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南京 师范 大 学 地 理科 学 学 院 发 起 并 组 织 编写 地 理 信息 系统 专业 系列 教材 , 奋 
斗 三 载 ,先后 问世 ,这 是 我 国 第 一 套 全 面 阐述 地 理 信 息 系统 理论 .方法 .技术 和 应 用 
的 教科 书 。 对 于 地 理学 科 的 现代 化 ,信息 科学 新 型 人 才 的 培训 ,落实 科教 兴国 战 
略 ,深化 教学 改革 来 说 ,都 是 值得 庆贺 的 。 

据 中 国 科学 院 地 学 部 调查 (2002) ,全 国 综合 性 大 学 共有 150 个 地 理学 科 机 构 ， 
在 地 学 领域 中 居 首 位 ,而 地 理 信息 系统 专业 脱颖而出 ,发 展 最 快 。21 世纪 初 ,已 设 
置地 理 信息 系统 专业 的 学 校 有 70 多 个 , 仅 江 苏 省 内 就 有 12 个 。 这 是 经 济 发 展 、 社 
会 进步 的 客观 需求 。 面 对 全 社会 数字 化 的 浪潮 ,“ 数 字 地 球 ”数字 化 城市 .省 区 与 
流域 , 百 箱 争 流 。 地 理 信息 系统 作为 人 口 .资源 与 环境 问题 的 公共 平台 ,作为 国家 
推动 信息 化 、 实 现 现代 化 的 重要 组 成 部 分 ,正在 与 电子 政务 .电子 商务 信息 系统 相 
融合 , 愈 来 愈 显示 出 其 跨行 业 、 多 功能 的 优势 ,不 断 开拓 新 的 应 用 领域 。 一 些 涉 及 
地 理 分 布 现 象 的 数据 采集 时空 分 析 , 涉及 城市 或 区 域 规划 ,管理 与 决策 的 过 程 ,都 
喜欢 用 上 地 理 信息 系统 这 种 新 的 技术 手段 ,来 提高 办 公 自 动 化 的 水 平 , 提 高 企业 科 
学 管理 的 效率 和 透明 度 ,加 强 面 对 国际 市 场 的 开放 力度 和 竞争 能 力 。 近 20 年 来 ， 
全 国 范围 从 事 地 理 信息 系统 的 事业 、 企 业 单位 ,迅猛 增长 ,已 超过 400 个 ,而 且 方 兴 
未 艾 ,与 时 俱 进 。 

中 国 科 学 院 地 学 部 地 学 教育 研究 组 在 咨询 报告 (2002) 中 指出 ;“ 随 着 社会 和 科 
技 的 发 展 ,地 学 的 内 涵 ,性 质 和 社会 功能 也 在 变化 。 这 在 最 近 20 年 中 尤为 明显 : 遥 
感 , 信 息 技术 和 各 种 实时 观测 、 分 析 技 术 的 发 展 ,使 地 球 科学 进入 了 覆盖 全 球 、 穿 越 
圈 层 , 即 地 球 系 统 科学 的 新 阶段 ,从 局 部 现象 的 描述 ,推进 到 行星 范围 的 推理 探索 ， 
获得 了 全 球 性 和 系统 性 的 信息 。 这 就 是 说 ,从 学 科 的 本 质 及 其 自身 发 展 的 规律 来 
看 ,地 理 信息 系统 不 仅仅 是 技术 ,而 且 是 科学 ,是 发 展 地 球 系统 科学 不 可 缺少 的 
部 分 。 

地 理 信息 系统 之 所 以 一 枝 独 秀 ,并 非 偶然 ! 主要 是 由 于 它 本 身 具备 多 样 化 的 
社会 功能 。 社 会 信息 化 的 主要 内 容 包 括 三 个 方面 :一 是 信息 基础 设施 的 建设 ,地 理 
信息 系统 正 是 地 图 测绘 的 数字 化 产品 ,同时 又 是 兼 收 并 容 膛 感 . 定 位 系统 的 缓冲 
区 ,起 着 调节 网 络 信息 流 的 作用 ;二 是 产业 结构 调整 ,地 理 信息 系统 起 着 润滑 剂 的 
作用 ,以 信息 流 调控 物流 、 能 流 和 人 流 ,以 信息 化 促进 现代 化 ;三 是 信息 服务 ,地 理 
信息 系统 是 电子 政务 .电子 商务 信息 系统 不 可 分 割 的 组 成 部 分 。 在 航天 事业 、 电 信 
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网 络 和 电脑 技术 日 新 月 异 的 21 世纪 ,地 理 信 息 系统 如 虎 添 导 ,广泛 地 渗透 到 各 行 
各 业 之 中 ,提供 无 微 不 至 的 信息 服务 。 

地 理 信 息 系统 教材 ,前 人 多 以 综 论 形式 出 版 。 例 如 , 英文 教材 先后 有 D.R. 
Tayilor(1991 ) ,J. C. Autenucci et al. (1991) ,M.D.I. Goodchild(1991) ,M. M. Fish- 
er(1993 ) , Murai Shuji(1996 ) ,D. Rhind (2000); 中 文教 材 先后 有 黄 禁 元 、 汤 勤 
(1989) , 边 柳 苓 (1996 ) ,陈述 彭 、 角 学 军 . 周 成 虎 (1999), 蓝 健 雅 (1999), 郭 伦 
(1999), 间 国 年 ,吴平 生 、 周 晓 波 (1999), 李 德 仁 、 关 泽 群 (2000), 马 议 乃 (2000), 王 
家 泡 (2001) 等 。 这 些 教材 对 地 理 信息 系统 的 科学 与 哲学 性 质 ,及 其 与 邻近 学 科 的 
相互 关系 , 均 有 精辟 论述 。 地 理 信息 系统 应 用 专 论 方面 ,城市 : 曹 桂 发 等 (1991), 宁 
小 冬 . 叶 嘉 安 (1995) , 宫 鹏 (1996) ,陈述 彭 (1999), 张 新 长 等 (2001); 林 业 : 李 芝 寺 、 
孙 俊 平 (2000) ;农业 : 王 人 潮 (1999)。 这 些 专 论 密切 结合 相关 行业 ,具有 中 国 特色 。 
现在 , 间 国 年 教授 等 主持 编写 的 地 理 信 息 系统 专业 系列 教材 ,是 在 前 人 工作 的 基础 
上 , 博 采 众 家 之 所 长 ,继往开来 ,推陈出新 ,拓展 为 系列 教材 。 基 础 是 扎实 的 ,时 机 
是 成 熟 的 。 

这 套 系列 教材 的 编写 ,紧密 结合 地 理 信息 系统 专业 的 课程 设置 。 在 理论 方面 ， 
又 推出 了 一 部 新 作 , 从 哲学 的 高 度 来 探讨 地 理 信 息 系统 中 的 虚拟 时 空 。 系 列 教材 
的 重点 侧重 于 方法 ,技术 ,总 结 了 数据 集成 、 知 识 发 现 的 最 新 进展 ;率先 推出 数据 共 
享 . 虚 拟 环境 与 网 络 三 部 分 ,反映 地 理 信息 系统 的 生长 点 。 在 应 用 方面 ,主要 是 结 
合作 者 们 近年 参与 建设 项 目的 实践 ,加 以 总 结 和 提高 ,是 来 自生 产 第 一 线 的 “新 
知 ”, 目 前 已 涉及 土地 与 水 资源 管理 ,城市 规划 、 环 境 保护 以 及 设备 设施 管理 与 房产 
管理 等 ,今后 随 着 应 用 领域 的 拓展 ,还 会 有 旅游 、 物 流 等 地 理 信 息 系 统 教材 相继 
问世 。 

同学 们 可 以 根据 课程 设置 计划 ,循序 渐进 ,在 理论 方面 广泛 涉猎 ,解放 思想 , 开 
阔 眼 界 。 在 方法 .技术 方面 ,配合 辅导 教材 和 实习 大 纲 ,刻苦 钻研 ,掌握 关键 技术 ， 
学 以 致 用 。 在 应 用 方面 结合 个 人 志趣 .专长 与 就 业 需求 ,选修 其 中 一 二 门 , 理 清 不 
同行 业 的 应 用 特点 ,举一反三 。 系 列 教材 是 面向 整个 专业 的 ,并 不 要 求 每 位 同学 都 
把 全 部 教材 回回 吞咽 下 去 , 食 而 不 化 。 编 写 系 列 教 材 , 正 是 为 同学 们 提供 了 更 加 宽 
阔 的 学 习 园 地 .更 加 宽松 的 学 习 环 境 。 祝 同学 们 健康 成 长 ,时 刻 准 备 着 ,与 时 俱 进 ， 
开拓 创新 ,为 祖国 信息 化 和 现代 化 多 做 贡献 。 


中 国 科学 院 院 士 


7 


2003 新 年 


前 音 


地 理 信 息 系统 (GIS) 自 20 世纪 60 年 代 问 世 以 来 ,已 历经 40 多 个 春秋 。 随 着 
计算 机 技术 .通信 技术 的 普及 ,GIS 已 经 走出 实验 室 , 在 各 行业 内 得 到 了 广泛 的 应 
用 并 取得 了 和 良好 的 经 济 效益 和 社会 效益 。 越 来 越 多 的 来 自 不 同行 业 、 不 同 专业 的 
人 士 开始 利用 GIS 技术 解决 生产 和 社会 实践 中 的 问题 。 

本 书 旨 在 对 GIS 基础 软件 .应 用 软件 ,以 及 GIS 应 用 过 程 中 涉及 的 基本 的 GIS 
算法 及 其 应 用 做 一 较为 全 面 系统 的 介绍 和 分 析 。“ 算 法 ”一 词 源 于 公元 9 世纪 波斯 
数学 家 比 阿 勒 * 霍 瓦 里 松 的 一 本 影响 深远 的 著作 《代数 对 话 录 》。 英 国 数学 家 图 灵 
在 20 世纪 提出 了 著名 的 图 灵 论 点 ,并 抽象 出 了 一 台 机 器 ,这 台 机 器 被 我 们 称 为 图 
灵机 。 图 灵 的 思想 对 算法 的 发 展 起 到 了 重要 的 作用 。 算 法 是 指 完成 一 个 任务 所 需 
要 的 具体 步骤 和 方法 。 完 成 同样 任务 ,不 同 的 算法 可 能 使 用 不 同 的 时 间 和 空间 。 
算法 是 计算 机 处 理 信 息 的 本 质 ,因为 计算 机 程序 本 质 上 是 一 个 算法 ,告诉 计算 机 确 
切 的 步骤 来 执行 一 个 指定 的 任务 。 一 般 地 , 当 算 法 在 处 理 信息 时 ,数据 会 从 输入 设 
备 读 取 , 写 人 输出 设备 ,可 能 保存 起 来 以 供 后 期 使 用 。 随 着 地 理 信息 系统 在 各 个 领 
域 中 更 为 广泛 的 应 用 ,对 GIS 算法 的 研究 变 得 日 益 重 要 。GIS 算法 作为 处 理 地 理 
科学 领域 中 各 种 问题 的 分 析 求 解 方法 ,有 着 鲜明 的 特点 。 首 先 ,GIS 算法 是 用 来 解 
决 地 学 领域 中 的 问题 ,但 许多 算法 都 不 是 孤立 的 ,不 是 无 源 之 水 ,无 本 之 木 ,而 是 借 
鉴 和 发 展 了 其 他 学 科 的 研究 成 果 ; 其 次 ,GIS 算法 处 理 的 往往 是 海量 的 地 理 信息 ， 
涉及 许多 复杂 的 空间 运算 ,不 同 于 简单 的 数据 查询 ,编辑 操作 ;再 次 ,地理 信息 系统 
与 实际 应 用 、 工 程 开发 有 着 密切 的 关系 ,GIS 算法 与 一 般 算 法 很 重要 的 一 个 区 别 就 
是 要 处 理 问 题 的 不 确定 性 , 它 无 法 被 定性 定量 成 一 个 非常 明确 的 纯 算法 问题 。 例 
如 ,标注 一 条 河流 ,标注 必须 靠近 河流 但 是 不 能 与 其 相交 ,标注 的 走向 与 河流 一 致 
但 又 不 能 覆盖 地 图 上 的 其 他 要 素 ,标注 必须 间隔 一 致 但 又 不 允许 太 大 也 不 能 太 小 
等 ,不 一 而 足 。 本 书 将 更 多 地 从 计算 机 算法 的 角度 来 阐述 GIS 算法 的 设计 原则 、 
分 析 方 法 、 技 巧 以 及 相关 的 评价 。 

GIS 与 各 类 学 科 都 有 密切 的 联系 ,GIS 算法 与 地 理科 学 、 计 算 机 科学 、 数 学 等 
同样 有 着 千 丝 万 缕 的 关系 。GIS 的 许多 算法 都 是 从 计算 几何 、 计 算 图 形 学 .离散 数 
学 演化 而 来 的 。 它 是 整个 地 理 信息 科学 的 核心 ,不管 是 从 基本 的 GIS 空间 数据 结 
构 到 空间 数据 模型 ,还 是 从 必需 的 GIS 空间 关系 的 表达 与 描述 到 各 种 各 样 的 空间 
拓扑 关系 ,抑或 是 从 高 级 的 时 态 多 维 GIS 到 GIS 空间 数据 挖掘 与 知识 发 现 ,GIS 
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算法 作为 地 理 信 息 系统 的 基石 当之无愧 。GIS 算法 是 一 个 富 集 优 雅 技术 和 复杂 数 
学 分 析 结 果 的 领域 ,一 个 好 的 算法 或 数据 结构 可 能 使 某 个 原来 需要 数 月 才能 完成 
的 问题 在 项 刻 之 间 得 到 解决 。 在 实际 的 应 用 中 ,往往 需要 考虑 各 方面 的 因素 ,可 能 
需要 利用 时 间 来 换取 空间 ,也 有 可 能 必须 牺牲 效率 来 获得 最 佳 的 存储 性 能 , 换 句 话 
来 说 , 即 可 能 没有 放 之 四 海 而 皆 准 的 最 优 算法 。 因 此 掌握 GIS 算法 的 设计 原则 ， 
剖析 各 种 GIS 分 析 方 法 ,灵活 应 用 一 些 技巧 自 有 其 用 武之 地 。 

本 书 第 1 章 由 张 宏 \ 温 永宁 编写 ;第 2 章 由 张 宏 、 张 强 、 刘 二 年 编写 ;第 3 章 由 
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14.3.1 平行 线 绘制 ppp (319) 
14.3.2 ”虚线 绘制 pp (321) 
14.3.3 短 齿 线 的 绘制 (322) 
14.3.4 ”铁路 线 的 绘制 (324) 
14.3.5 境界 线 的 绘制 (326) 
14.4 面 状 地 图 符号 的 绘制 (328) 
思考 组 (333) 


第 1 章 算法 设计 和 分 析 
1.1 概 述 


算法 是 解决 问题 方法 的 精确 描述 ,但 是 并 不 是 所 有 问题 都 有 算法 ,有 些 问 题 经 
研究 可 行 , 则 相应 有 算法 ,但 这 并 不 是 说 问题 就 有 结果 。 上 述 的 “可 行 ”, 是 指 对 算 
法 的 研究 。 


1. 待 解 问题 的 描述 


待 解 问题 的 描述 应 精确 、 简 练 、 清 楚 , 使 用 形式 化 模型 刻画 问题 是 最 恰当 的 。 
例如 ,使 用 数学 模型 刻画 问题 是 最 简明 严格 的 ,一 旦 问题 形式 化 了 ,就 可 依据 严格 
的 模型 对 问题 求解 。 


2. 算法 设计 


算法 设计 的 任务 是 对 各 类 具体 问题 设计 良好 的 算法 及 研究 设计 算法 的 规律 和 
方法 。 常 用 的 算法 有 穷 举 搜索 法 .递归 法 、 回 淹 法 贪心 法 .分 治 法 等 。 


3. 算法 分 析 
算法 分 析 的 任务 是 对 设计 出 的 每 一 个 具体 的 算法 ,利用 数学 工具 ,讨论 各 种 复 
杂 度 ,以 探讨 某 种 具体 算法 适用 于 哪 类 问题 ,或 某 类 问题 宜 采用 哪 种 算法 。 
1.2 算法 设计 原则 


设计 的 真 诺 , 就 是 在 一 些 互相 冲突 的 需求 和 约束 条 件 之 间 寻 找平 衡 点 。 什 么 
是 一 个 良好 的 算法 ? 这 个 问题 可 以 从 许多 方面 来 前 述 ,不 管 是 哪 种 情况 ,都 无 法 放 
之 四 海 而 皆 准 ,但 总 有 一 些 原 则 是 在 不 断 的 探索 中 被 发 现 并 潜移默化 地 影响 着 我 
们 的 思维 。 算 法 的 设计 应 当 遵循 以 下 一 些 原则 : 


1. 正确 性 


算法 的 正确 性 是 指 对 于 一 个 问题 ,之 所 以 将 其 放 在 第 一 位 是 因为 如 果 一 个 算 
法 自身 有 缺陷 ,或 者 不 适合 于 问题 的 求解 ,那么 该 算法 将 不 会 解决 问题 。 
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2. 确定 性 


算法 的 确定 性 是 指 算法 的 每 个 步骤 必须 含义 明确 ,对 每 种 可 能 的 情况 ,算法 都 
能 给 出 确定 的 操作 。 即 采用 同一 种 算法 ,在 同样 的 条 件 下 无 论 计算 多 少 次 ,始终 能 
够 得 到 确定 的 结果 。 


3. 清晰 性 


一 个 良好 的 算法 必须 思路 清晰 ,结构 合理 。 算 法 的 设计 要 模块 化 。 模 块 化 是 
指 将 一 个 大 的 算法 分 解 成 若干 小 而 简单 的 部 分 一 一 模块 ,每 个 模块 可 以 独立 地 编 
写 ,测试 ,最 后 组 装 完成 整个 算法 。 模 块 化 的 目的 是 使 算法 的 结构 清晰 ,容易 阅读 ， 
容易 理解 ,容易 测试 ,容易 修改 。 模 块 化 的 分 割 原则 要 符合 抽象 原则 , 即 指 每 个 模 
块 都 要 有 明确 的 抽象 意义 。 例 如 ,在 面向 对 象 方法 中 ,建立 一 个 类 的 主要 依据 是 该 
类 描述 的 抽象 数据 类 型 (ADT)。 


1.3 算法 复杂 性 的 度量 


算法 的 复杂 性 包括 算法 的 时 间 复 杂 性 和 算法 的 空间 复杂 性 。 为 了 说 明 复 杂 性 
的 概念 , 先 介绍 问题 规模 的 概念 。 用 一 个 与 问题 相关 的 整数 量 来 衡量 问题 的 大 小 ， 
该 整数 量 表 示 输 入 数据 量 的 尺度 , 称 为 问题 的 规模 。 比 如 ,行列 式 的 规模 可 以 用 其 
阶 数 n 来 表示 ,图 问题 的 规模 可 以 用 其 边 数 或 顶点 数 来 表示 等 。 

利用 某 算法 处 理 一 个 问题 规模 为 ”的 输入 所 需要 的 时 间 , 称 为 该 算法 的 时 间 
复杂 性 。 它 显然 是 ”的 函数 , 记 为 T(n)。 

类 似 地 可 以 定义 算法 的 空间 复杂 性 S(n)。 

下 面 主 要 讨论 算法 的 时 间 复 杂 性 。 由 于 一 般 不 需要 知道 精确 的 时 间 耗 费 , 只 
要 知道 时 间 耗 费 的 增长 率 大 体 在 什么 范围 内 即 可 ,因此 我 们 引入 算法 复杂 性 阶 的 
概念 。 


1.3.1 时 间 复 杂 性 


1. 阶 的 增长 


显而易见 ,说 一 个 算法 A 对 于 输入 x 要 用 y 秒 运行 是 没有 意义 的 。 这 是 因为 
影响 实际 时 间 的 因素 不 仅 有 相应 算法 ,还 有 其 他 诸多 因素 ,例如 ,算法 是 在 什么 机 
器 上 和 怎样 执行 的 ,用 的 是 哪 一 种 语言 ,甚至 编译 程序 或 程序 员 的 能 力 都 有 影响 。 
因此 只 要 得 出 确切 时 间 的 近似 数 就 可 以 了 。 但 是 最 重要 的 是 ,在 评估 一 个 算法 效 
率 的 时 候 , 我 们 需要 的 是 确切 时 间 还 是 近似 时 间 ? 事实 上 ,我 们 甚至 不 需要 近似 时 
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间 , 这 是 由 许多 因素 造成 的 。 首 先 , 在 分 析 算 法 运行 时 间 时 ,我 们 通常 将 该 算法 和 
解决 同一 问题 甚至 是 不 同 问题 的 算法 相 比 较 , 这 样 , 估 计时 间 是 相对 的 而 不 是 绝对 
的 ;其 次 ,我 们 希望 一 个 算法 不 仅 是 独立 于 机 器 的 ,而 且 它 也 能 够 用 各 种 语言 来 表 
示 , 甚 至 是 人 类 语言 ;再 者 , 它 还 应 该 是 技术 独立 的 ,也 就 是 说 ,无 论 科 技 如 何 进 步 ， 
我 们 对 算法 运行 时 间 的 测度 始终 成 立 ; 第 四 ,我 们 主要 不 是 关心 小 规模 输入 量 的 情 
况 , 最 关心 的 是 在 大 的 输入 实例 时 算法 的 运行 情况 。 

事实 上 ,在 算法 的 某 个 “合理 ”实现 中 的 计算 运算 次 数 ,是 比 它 所 需要 的 多 了 一 
些 。 作 为 上 面 第 四 种 因素 的 推论 ,我 们 可 以 前 进 一 大 步 :要 精确 计算 所 有 的 运算 次 
数 ,如 果 不 是 不 可 能 的 话 ,也 是 非常 麻烦 的 。 由 于 我 们 只 对 大 的 输入 时 的 运行 时 间 
感 兴趣 ,可 以 讨论 运行 时 间 的 增长 率 或 增长 的 阶 。 例 如 ， 如果 可 以 找到 某 个 常量 
c>0, 当 给 算法 A 以 大 小 为 的 输入 时 ,算法 的 运行 时 间 至 多 为 cn?, 随 着 ” 越 来 
越 大 ,c 将 逐渐 不 起 作用 。 进 一 步 ,把 这 个 卫 数 和 另 一 个 求解 同一 问题 的 算法 B 
的 不 同 阶 的 函数 (例如 dn’) 做 比较 ,很 明显 ,该 常量 并 不 起 多 大 作用 。 为 了 解释 这 
一 点 , 记 两 个 函数 的 比值 是 dn Vc , 当 n 变 得 很 大 时 ,qd /ec 实际 上 没有 什么 作用 。 
同样 的 道理 可 用 于 函数 f(n)= n?logn + 10n*+n 中 的 低 阶 项 上 ,我 们 观察 到 z 
值 越 大 , 低 阶 项 10n? 和 2 的 影响 就 越 小 。 因 此 ,可 以 说 算法 A 和 B 的 运行 时 间 
分 别 为 “n? 阶 和 za 阶 的 ”或 属于 “n? 阶 和 23 阶 的 ”。 类 似 地 ,我 们 说 上 面 的 函数 
f(n) 是 22logz 阶 的 。 

一 旦 去 除了 表示 算法 运行 时 间 的 函数 中 的 低 阶 项 和 首 项 常数 ,就 称 我 们 是 在 
度量 算法 的 渐 近 运行 时 间 。 与 此 相同 ,在 算法 分 析 的 术语 中 ,可 以 用 更 为 技术 性 的 
术语 "时间 复杂 性 ”来 表示 这 一 渐 近 时 间 。 

现在 假定 有 两 个 算法 4; 和 A; ,运行 时 间 都 为 nlogn 阶 ,那么 其 中 哪 一 个 更 
好 呢 ? 从 技术 上 看 ,由 于 两 个 算法 有 同样 的 时 间 复 杂 性 ,我们 就 说 在 一 个 乘法 常数 
内 ,它们 有 相同 的 运行 时 间 ,也 就 是 两 个 运行 时 间 的 比值 是 常量 。 在 某 些 情况 下 ， 
这 个 常量 可 能 很 重要 ,对 算法 更 详尽 的 分 析 或 在 算法 的 行为 上 进行 某 些 试验 可 能 
很 有 帮助 。 而 且 这 时 考查 其 他 因素 ,例如 ,空间 需求 和 输入 分 布 等 也 有 必要 ,后 者 
对 分 析 算 法 运行 的 平均 情况 是 有 帮助 的 。 

图 1.1 是 一 些 广 泛 用 来 表示 算法 运行 时 间 的 函数 ,高 阶 函 数 和 指数 以 及 超 指 
数 函 数 没 有 在 这 张 图 上 显示 出 来 。 即 使 x 为 一 个 中 等 的 值 ,指数 和 超 指数 函数 也 
比 图 中 的 几 个 函数 增长 得 快 得 多 。 这 几 种 类 型 的 函数 log*n ,cn , cn?, cn? 分 别称 
为 对 数 函 数 、 线 性 函数 .平方 函数 和 立方 函数 ,下 面 两 种 函数 的 形式 n' 或 nlogkn， 
0<c<1 称 为 次 线性 函数 ;在 线性 函数 和 平方 函数 之 间 的 ,如 nlogn 和 n15, 称 为 次 平 
方 函数 。 表 1.1 是 时 间 复 杂 性 分 别 为 logn ,n,nlogn,n’,n3,2”(n = 23,24，, 

22 ) 的 算法 的 近似 运行 时 间 ,假定 每 次 执行 用 时 lns。 注 意 在 阶 为 2* 时 ,运行 时 间 
是 爆炸 性 的 (以 世纪 为 单位 来 衡量 )。 
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中 nlogn 
泪 
n 
logn 
输入 大 小 
图 1.1 一 些 表示 运行 时 间 的 典型 函数 的 增长 情况 
表 1.1 不 同 大 小 输入 的 运行 时 间 
2 logn n nlogn n? n’ 2 
8 3nsec 0.01p 0.02 0. 06p 0.51p 0.26p 
16 4nesc 0.021 0.064 0.267 4 .1 65.5p 
32 Snesc 0.03n 0.16n 1.027 32 .7 4.29cent 
64 Onesc 0.06n 0.38p 4.1n 262p 5.85cent 
128 0.01p 0.13p 0.9p 16.38p 0.01sec 1020cent 
256 0.01p 0.261 2.0Sn 65.54p 0.02sec 1058cent 
512 0.014 0.51n 4.61y 262.14p 0.13sec 10138cent 
2048 0.01¢ 2.054 22.534 0.01sec 1.07sec 1059%8cent 
4096 0.014 4.1p 49.15¢ 0.02sec 8.4sec 10Li4cent 
8192 0.01p 8.197 106.5p 0.07sec 1.15min 102447cent 
16 384 0.01r 16.38p 229.38p 0.27sec 1.22hrs 104913cent 
32 768 0.02p 32.774 491.52p 1.07sec 9.77hrs 10%45cent 
65 536 0.024 65.54p 1048.64 0.07sec 3.3days 10197ocent 
131 072 0.027 131.07p 2228.21 0.29sec 26days 1039438cent 
262 144 0.024 262.147 4718.6n 1.15sec 7months 10788%4cent 
524 288 0.02 524.29p 9961.5p 4.58sec 4.6years 10157808cent 
1 048 576 0.024 1048.6p 20 972y 18.3sec 37years 10315634cent 


注 :nesc 为 纳 秒 ,y 为 毫秒 ,sec 为 秒 ,min 为 分 钟 ,hrs 为 小 时 , days 为 天 ,months 为 月 ,years 为 年 ,cent 为 


世纪 。 
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对 任何 计算 步骤 , 它 的 代价 总 是 以 一 个 时 间 常 量 为 上 界 ,而 不 管 输入 数据 或 执 
行 的 算法 ,我 们 称 该 计算 步骤 为 “元 运算 ”。 例 如 , 取 两 个 整数 相 加 的 运算 ,不 管 使 
用 何 种 算法 ,我 们 都 规定 它 的 运算 对 象 的 大 小 是 固定 的 ,这 一 运算 的 运行 时 间 是 常 
数 。 而 且 由 于 现在 是 处 理 渐 近 的 运行 时 间 ,我 们 可 以 任意 选择 正 整 数 & 为 “计算 
模型 "的 “ 字 长 "。 顺 便 说 一 下 ,这 仅仅 是 一 个 表现 渐 近 符号 的 优越 性 的 例子 , 字 长 
可 以 是 任何 固定 的 正 整数 。 如 果 要 把 任意 大 的 数 相 加 ,很 容易 根据 加 法 的 元 运算 
写 出 相应 的 算法 , 它 的 运行 时 间 和 输入 的 大 小 成 正比 。 同 样 应 用 固定 大 小 的 条 件 ， 
我 们 能 从 一 个 大 的 运算 集合 中 ,随心所欲 地 选择 多 个 元 运算 。 下 面 是 在 固定 大 小 
运算 对 象 上 元 运算 的 例子 : 

(1) 算术 运算 ,包括 加 、 减 、 乘 和 除 ; 

(2) 比较 和 逻辑 运算 ; 

(3) 赋值 运算 ,包括 遍历 表 或 树 的 指针 赋值 。 

为 了 使 增长 的 阶 和 时 间 复 杂 性 这 两 个 概念 形式 化 ,已 经 广泛 使 用 了 特殊 的 数 
学 符号 ,这 些 符号 便于 运用 最 小 的 复杂 数学 计算 来 比较 和 分 析 运 行 时间 。 


2..0 符号 


以 插入 排序 算法 为 例 了 ,算法 的 执行 的 元 运算 次 数 至 多 为 cn?, 其 中 。 为 某 个 
适当 选择 的 正常 数 。 这 时 ,说 插入 排序 算法 的 运行 时 间 是 O(nw?*)。 这 可 以 做 如 下 
解释 :只 要 当 排 序 元 素 的 个 数 等 于 或 超过 某 个 立 值 no 时 ,那么 对 某 个 常数 c >0， 
运行 时 间 至 多 为 cn*。 应 当 强 调 的 是 ,即使 是 在 输入 很 大 的 时 候 , 也 不 能 说 运行 时 
间 总 是 恰好 为 cn*。 这 样 ,O 符号 提供 了 一 个 运行 时 间 的 上 界 , 它 可 能 不 是 算法 的 
实际 运行 时 间 。 例 如 ,对 于 任意 值 n, 当 输入 已 经 按 升序 排列 时 ,插入 排序 算法 的 
运行 时 间 是 O(n)。 

一 般 地 ,说 一 个 算法 的 运行 时 间 是 O(g (x)), 是 指 如 果 每 当 输 入 的 大 小 等 于 
或 超过 某 个 阐 值 no 时 ,那么 它 的 运行 时 间 上 限 是 g(n) 的 c 售 ,其 中 <c 是 某 个 正 
常数 。 该 符号 的 形式 定义 如 下 。 | 

定义 : 令 f(n) 和 g(n) 是 从 自然 数 集 到 非 负 实数 集 的 两 个 函数 ,如 果 存 在 一 
个 自然 数 no 和 一 个 常数 c >0, 使 得 

V7z2 moyj(z) 委 cg(m) 
则 称 f(n) 为 O(g(n))。 
因此 ,如 果 limf(n)/g(n) 存在 ,那么 


a (号 天 给 全 着 f(n) = OCg(n))。 





lim 





@ ”有关 插入 排序 算法 的 内 容 请 参阅 计算 机 数据 结构 相关 方面 的 书籍 ,这 里 不 再 进行 详细 的 论述 。 
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非 形式 地 ,这 个 定义 说 明 f 没有 g 的 某 个 常数 倍增 长 得 快 。O 符号 也 可 作为 
一 个 简化 工具 用 在 等 式 中 。 例 如 ,对 于 
fln) = Sn +7n2+2n+13 
可 以 写成 
fln) = 5n?3 + O(n’) 
如 果 我 们 对 低 阶 项 的 细节 不 感 兴趣 时 ,这 是 有 帮助 的 。 


3. 2 符号 


O 符号 给 出 一 个 上 界 , 而 2 符号 在 运行 时 间 的 一 个 常数 因子 内 提供 一 个 下 
界 。 我 们 已 知 执行 插入 排序 算法 的 元 运算 次 数 至 少 是 cn ,ec 为 某 一 合适 的 正常 
数 。 在 这 种 情况 下 , 称 插入 排序 算法 的 运行 时 间 是 0(n)。 这 可 以 做 如 下 解释 :无 
论 何 时 , 当 被 排序 的 元 素 个 数 等 于 或 超过 某 一 个 辣 值 no 时 ,那么 对 某 个 常数 c > 
0, 运 行 时 间 至 少 是 cn。 与 O 符号 相同 的 是 ,这 不 意味 着 运行 时 间 总 是 像 cn 那么 
小 。 这 样 ,9 符号 给 出 了 运行 时 间 的 下 限 , 它 可 能 不 指示 一 个 算法 确切 的 运行 时 
间 。 例 如 ,对 于 x 的 任意 值 ,如 果 输 入 由 互 不 相同 的 按 降序 排列 的 元 素 组 成 , 则 插 
入 排序 算法 的 运行 时 间 是 Q(n?)。 

一 般 而 言 ,如 果 输 入 大 小 大 于 或 等 于 某 一 立 值 no, 它 的 运行 时 间 下 界 是 g(n) 
的 c 倍 ,c 是 某 个 正常 数 , 则 称 算法 是 Q(g(n))。 

这 个 符号 也 被 广泛 用 于 表示 问题 的 下 界 。 换 句 话 说 , 它 通常 用 来 表示 解决 某 
一 特定 问题 的 算法 的 下 界 。 例 如 ,我 们 说 矩阵 乘法 问题 为 0(n?), 这 是 对 “任何 两 
个 n x 的 矩阵 乘法 的 算法 都 是 Q(m*)” 的 简 上 略语。 同样 地 ,我 们 说 比较 排序 问题 
的 比较 次 数 为 2 (nlogn ) ,是 指 无 法 设计 出 基于 比较 的 排序 算法 , 它 的 时 间 渐 近 复 
杂 性 小 于 nlogn。 该 符号 的 形式 定义 和 O 符号 相对 称 。 

定义 : 令 f(n) 和 g(n) 是 从 自然 数 集 到 非 负 实数 集 的 两 个 沙 数 ,如 果 存 在 一 
个 自然 数 no 和 一 个 常数 c >0, 使 得 

Vn>no,f(n) 之 cg(n) 

则 称 f(xn) 为 Q(g(n))。 

es nn) 存在 ,那么 





Ce 天 0 蕴含 着 f(n)= 0Q(g8(n)) 


非 形式 地 ,这 个 定义 说 明 的 增长 至 少 和 g 的 某 个 常数 倍 一 样 快 。 从 定义 可 
以 很 清楚 地 得 到 f(x) 是 Q(g(n)), 当 上 且 仅 当 g(n) 是 O(f(n))。 


4. @ 符号 
前 面 已 经 看 到 ,插入 排序 算法 执行 元 运算 次 数 总 是 和 22 成 正比 ,由 于 每 一 个 
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元 运算 需要 一 个 常量 时 间 , 我 们 说 插入 排序 算法 的 运行 时 间 是 86(n?)。 可 做 如 下 
解释 :存在 与 算法 有 关 的 两 个 常数 c; 和 cz ,在 ”之 zo 的 任何 大 小 的 输入 情况 下 ， 
算法 运行 时 间 在 c1n?* 和 con? 之 间 。 这 两 个 常数 概括 了 许多 诸如 算法 执行 、. 机 器 
或 技术 等 细节 方面 的 因素 。 像 前 面 提 到 过 的 那样 ,程序 执行 的 细节 问题 包括 使 用 
的 程序 设计 语言 .编程 者 的 技能 等 许多 因素 。 

一 般 来 说 ,对 于 任何 大 小 等 于 或 超过 某 一 阐 值 no 的 输入 ,如 果 运 行 时 间 在 下 
限 cig(n) 和 上 限 cxzg(z) 之 间 (0< ci 委 cz), 则 称 算法 的 运行 时 间 是 96(g(n)) 阶 
的 。 因 此 ,这 一 符号 是 用 来 表示 算法 的 精确 阶 的 , 它 蕴 含 着 在 算法 的 运行 时 间 上 有 
确切 界限 。 该 符号 的 形式 定义 如 下 。 

定义 : 设 f(n) 和 g(n) 是 从 自然 数 集 到 非 负 实数 集 的 两 个 函数 ,如 果 存 在 一 
个 自然 数 no 和 两 个 正 数 cl 和 cs ,使 得 

Vn 宕 noscig(n) fn) 多 
则 称 f(xn) 为 @(g(n))。 
因此 ,如 果 limf(n)/g(n) 存 在 ,那么 


. f(n) 
im 


RE(7) 


其 中 ,c 必需 是 一 个 大 于 零 的 常数 。 

上 述 定义 的 一 个 重要 推论 是 

fl(n)=B@(g(n)), 当 和 目 仅 当 f(n)=O(lg(n)) 并 且 f(n)=Q(g(n))。 
与 前 两 个 符号 不 同 , @ 符号 给 出 算法 运行 时 间 增 长 率 的 一 个 精确 描述 。 


5. 复杂 性 类 与 o 符号 


令 R 是 复杂 性 函数 集合 上 由 下 列 条 件 定义 的 关系 : fRg 当 且 仅 当 jz ) = 
9(g(n))。 显 然 ,R 是 自 反 的 、 对 称 的 、 可 传递 的 , 即 是 一 个 等 价 关 系 ,由 这 个 关系 
导出 的 等 价 类 称 为 复杂 性 类 。 有 复杂 性 函数 g(n) 属 于 的 复杂 性 类 ,包括 所 有 的 
阶 为 6(g(n)) 的 函数 f(n)。 例 如 ,所 有 二 次 多 项 式 属于 同一 个 复杂 性 类 n?。 为 
了 说 明 两 个 函数 属于 不 同 的 类 ,用 o 记号 ( 读 做 “小 o”) 是 很 有 用 的 ,定义 如 下 。 

定义 : 令 f(n) 和 g(n) 是 从 自然 数 集 到 非 负 实数 集 的 两 个 函数 ,如 果 对 每 一 
个 常数 c >0, 存 在 一 个 正 整数 no ,使 得 对 于 所 有 的 2 之 xzo, 都 有 f(n)<cg(n) 成 
立 , 则 称 f(n) 是 ol(g(n)) 的 。 

因此 ,如 果 limf(n)/g(n 7 ) 存 在 ,那么 
fn) 

g(n) 


非 形式 地 ,这 个 定义 是 说 , 当 n 趋 于 无 穷 时 , f(n) 对 于 g(n) 可 以 忽略 不 计 。 





=c 蕴含 着 f(n)=@(g(n))- 





=0 蕴含 着 f(n)=o(g(n)) 


lim 
和 
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这 可 从 下 面 的 定义 得 出 
f(n)=ol(g(n)), 当 且 仅 当 f(n)=O(g(n)), 但 g(n) 关 o(f(n)) 
例如 ,nlogn 是 o(n?) 的 ,等 价 于 nlogn 是 o(n?) 的 ,但 nn? 不 是 ol(nlogn) 的 。 
我 们 用 f(n)<g(n) 来 表示 f(n) 是 o(g(n)) 的 ,用 这 种 记号 可 以 简明 地 表 
达 下 面 复 杂 性 类 的 层次 : 
1 < loglogn < logn <Vn < ns4<n< nlogn < n:<2*<nl! <2" 


1.3.2 空间 复杂 性 


我 们 把 算法 使 用 的 空间 定义 成 :为 了 求解 问题 的 实例 而 执行 的 计算 步 又 所 
需要 的 内 存 空间 (或 字 ) 数 目 , 它 不 包括 分 配 用 来 存储 输入 的 空间 。 换 句 话说 , 仅 
仅 是 算法 需要 的 工作 空间 。 不 包括 输入 大 小 的 原因 基本 上 是 为 了 区 分 那些 在 整 
个 计算 过 程 中 占用 了 “ 少 于 ”线性 空间 的 算法 。 所 有 关于 时 间 复 杂 性 增长 的 阶 的 
定义 和 渐 近 界 的 讨论 都 可 移植 到 空间 复杂 性 的 讨论 中 来 。 显 然 算法 的 空间 复杂 
性 不 可 能 超过 运行 时 间 的 复杂 性 ,因为 写 人 每 一 个 内 存单 元 都 至 少 需要 一 定 的 
时 间 。 这 样 ,如果 用 了 T(z) 和 S(Cz) 分 别 代表 算法 的 时 间 复 杂 性 和 空间 复杂 性 ， 
则 有 S(n)=O(T(n))。 

假定 要 对 n = n”=1 048 576 个 元 素 排序 ,我 们 来 看 一 下 空间 复杂 性 的 重要 
性 。 如 果 用 选择 排序 算法 2 ,不 需要 额外 的 存储 空间 ;但 如 果 用 合并 排序 @ 的 算 
法 ,就 需要 n = nw?=1 048 576 个 额外 的 存储 单元 来 做 输入 的 暂 存 器 。 

很 自然 ,许多 问题 需要 在 时 间 与 空间 之 间 权 衡 :给 算法 分 配 的 空间 越 大 ,运行 
速度 就 越 快 ;反之 亦 然 。 当 然 ,这 样 做 是 有 限度 的 ,迄今 为 止 我 们 讨论 过 的 大 多 数 
算法 中 ,增加 空间 并 没有 导致 明显 的 速度 加 快 。 相 反 却 往往 成 立 , 即 减 小 空间 会 导 
致 算法 速度 的 降低 。 


1.4 最 优 算法 


任何 用 元 素 比 较 的 算法 对 大 小 为 n 的 数组 排序 , 它 的 运行 时 间 在 最 坏 的 情况 
下 必定 是 Q(nlgn) ,这 意味 着 不 能 期 望 一 个 算法 在 最 坏 情况 下 , 它 的 渐 近 运行 时 
间 少 于 nlgn。 因 为 这 个 理由 ,我 们 通常 把 在 O(nlgn ) 时 间 内 用 元 素 比较 法 排序 
的 任何 算法 , 称 为 基于 比较 的 排序 问题 的 最 优 算法 。 一 般 来 说 ,如 果 可 以 证 明 任何 
一 个 求解 问题 A 的 算法 必定 是 Q(F(z)) ,那么 我 们 把 在 O(f(n)) 时 间 内 求解 问 





@ 有 关 选 择 排序 算法 的 内 容 请 参阅 计算 机 数据 结构 相关 方面 的 书籍 ,这 里 不 再 进行 详细 的 论述 。 
@ 有 关 合 并 排序 算法 的 内 容 请 参阅 计算 机 数据 结构 相关 方面 的 书籍 ,这 里 不 再 进行 详细 的 论述 。 
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题 A 的 任何 算法 都 称 为 问题 A 的 最 优 算法 。 

顺便 指出 ,本 文中 被 广泛 使 用 的 定义 没有 考虑 空间 复杂 性 。 原 因 是 两 方面 的 ， 
首先 ,正如 前 面 指 出 的 那样 ,只 要 使 用 的 空间 在 一 个 合理 的 范围 内 ,时 间 要 比 空间 
珍贵 ;第 二 ,大 多 数 已 有 的 最 优 算 法 ,在 相互 比较 它们 的 空间 复杂 性 时 ,是 同 处 于 
O(n) 阶 内 的 。 : 


1.5 算法 的 评价 
1.5.1 如 何 估 计算 法 运行 时 间 


正如 前 面 讨论 过 的 那样 ,如 果 限 定 算法 用 到 的 运算 是 那些 我 们 定义 的 元 运算 ， 
那么 ,算法 运行 时 间 的 界限 是 面 上 、 辕 下 ,还 是 恰好 精确 的 界限 ,在 相差 一 个 常数 因 
子 的 范围 内 是 可 以 估计 的 。 现 在 剩 下 的 是 要 说 明 ,如 何 分 析 算 法 以 得 到 所 关心 的 
界限 。 当 然 可 以 把 所 有 元 运算 加 起 来 得 到 一 个 精确 的 界限 ,无疑 这 种 方法 是 不 可 
取 的 ,因为 它 十 分 麻烦 而 且 常 常 是 不 可 能 的 。 一 般 来 说 ,不 存在 一 个 固定 的 过 程 ， 
可 以 通过 它 来 得 到 算法 使 用 时 间 和 空间 的 “合理 "界限 。 而 且 , 这 项 工作 经 常 是 靠 
直 党 ,许多 情况 下 也 需要 机 智 。 但 是 ,在 许多 算法 中 有 一 些 公 认 的 技术 ,可 以 通过 
直接 分 析 给 出 一 个 紧密 界 。 下 面 用 一 些 简单 的 例子 来 讨论 这 些 技术 。 
1. 计算 迭代 次 数 

运行 时 间 常 常 和 while 循环 及 类 似 结构 的 执行 次 数 成 正比 。 这 样 ,计算 迭代 
的 次 数 将 很 好 地 表明 算法 的 运行 时 间 。 这 种 情况 适用 许多 算法 ,包括 搜索 、 排 序 、 
和 矩阵 乘法 等 。 

例 :考虑 下 面 的 算法 ,包含 两 个 诺 套 循环 和 一 个 变量 counz ,这 个 变量 用 来 对 
算法 执行 的 迭代 次 数 计数 ,这 时 输入 为 n=2*, 其 中 是 正 整 数 。 

while 循环 执行 上 +I 次 ,这 里 有 =logzz ,for 循环 执行 n 次 ,之 后 是 n/2,n/4,… 
次 。 因 此 ,第 4 步 的 执行 次 数 是 

之 = "之 本 一 m2 一 去 =2n—-1= O(n) 

由 于 运行 时 间 和 count 成 正比 ,可 以 知道 结果 是 @(n)。 

输入 :nn 二 2*,k 为 正 整数 。 

输出 :第 4 步 的 执行 次 数 count 

1. count < 0 

2. while n>=1 

3. forj<0ton 
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. COunt < count +1 
. end for 


.1 < 7A[D 


> Cn 人 


. end while 


8. return count 
2. 计算 基本 运算 的 频 度 


在 某 些 算法 中 ,用 前 面 的 方法 来 完成 算法 运行 时 间 的 精确 估算 是 很 麻烦 的 ,其 
至 是 不 可 能 的 。 如 合并 排序 算法 , 它 是 把 两 个 有 序数 组 合并 为 一 个 有 序数 组 。 如 
果 我 们 试图 采用 前 面 的 方法 ,分 析 将 变 得 元 长 而 困难 。 

一 般 来 说 ,在 分 析 一 个 算法 的 运行 时 间 时 ,可 以 挑选 出 一 个 具有 这 样 性 质 的 元 
运算 , 它 的 频 度 至 少 和 任何 其 他 运算 的 频 度 一 样 大 , 称 这 样 的 运算 为 基本 运算 。 我 
们 还 可 以 放宽 这 个 定义 ,把 那些 频 度 和 运行 时 间 成 正比 的 运算 包括 进来 。 

定义 :如 果 算 法 中 的 一 个 元 运算 具有 最 高 频 度 ,所 有 其 他 元 运算 频 度 均 在 它 的 
频 度 的 常数 倍 内 , 则 称 这 个 元 运算 为 基本 运算 。 

一 般 来 说 ,这 种 方法 是 由 这 样 两 部 分 组 成 的 :确定 一 种 基本 运算 和 应 用 渐 近 表 
达 式 来 找 出 这 种 运算 执行 的 阶 , 这 个 阶 将 是 算法 运行 时 间 的 阶 。 这 实际 上 是 一 大 
类 问题 选择 的 方法 。 这 里 列 出 这 些 基本 运算 中 的 若干 候选 者 : 

(1) 在 分 析 搜索 和 排序 算法 时 ,如 果 元 素 比 较 是 元 运算 , 则 可 以 选 它 为 基本 
运算 ; 
(2) 在 矩阵 乘法 算法 中 , 选 数量 乘法 运算 ; 

(3) 在 遍历 一 个 链表 时 ,可 以 选 设置 或 更 新 指针 的 运算 ; 

(4) 在 图 的 遍历 中 ,可 以 选 访问 节点 的 “动作 ”和 对 被 访问 节点 的 计数 。 

在 一 些 算法 里 ,所 有 的 元 运算 都 不 是 基本 运算 。 它 可 能 是 这 样 的 情况 :两 种 或 
者 更 多 的 运算 结合 在 一 起 的 频 度 与 算法 的 运行 时 间 成 正比 。 在 这 种 情况 下 ,用 的 
行 这 些 运算 的 总 次 数 的 函数 来 表示 运行 时 间 。 例 如 ,我 们 既 不 能 限定 插入 的 次 数 ， 
也 无 法 限定 删除 的 次 数 ,但 是 却 能 够 得 到 限定 它们 总 数 的 公式 。 那 么 可 以 这 样 说 : 
最 多 存在 n 个 插入 和 删除 。 这 个 办 法 在 图 和 网 络 的 算法 中 广泛 使 用 ,比如 ,有 关 
图 和 复杂 的 数据 结构 的 相关 算法 。 


3, 使 用 递 推 关系 


在 递归 算法 中 ,一 个 界定 运行 时 间 的 函数 常常 以 递 推 关系 的 形式 给 出 , 即 一 个 
函数 的 定义 包含 了 函数 本 身 , 例 如 , T(n)=2T(n/2) + n。 寻 找 递 推 式 的 解 已 经 
得 到 了 很 好 的 研究 ,其 至 可 以 机 械 地 得 到 它 的 解 。 推 导出 一 个 递 推 关系 , 它 界 定 一 
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个 非 递归 算法 中 基本 运算 的 数目 是 可 能 的 。 例 如 ,在 二 分 法 搜索 算法 ?中 ,如 果 
令 C(n) 为 一 个 大 小 是 n 的 实例 中 执行 比较 的 次 数 , 则 可 以 用 递 推 式 表示 算法 所 
做 的 比较 次 数 : 


1 ， 若 n=1 
全 | 六 二 时 人 攻守 六 2 
这 个 递 推 式 的 解 简化 成 如 下 的 和 ; 


Cl(n) C(In/2)D)+1 
=C(lln/21/2D+1+1 
=C(n/4l)+1+1 


=llognl+1 
也 就 是 C(n) 记 llognj+1, 因 此 C(n)= O(logn)。 由 于 在 二 分 搜索 算法 中 
元 素 比较 运算 是 基本 运算 ,因此 它 的 时 间 复 杂 性 是 O(logn )。 


1.5.2 最 坏 情况 和 平均 情况 的 分 析 


考虑 两 个 n x.n 的 整数 矩阵 A 和 B 相 加 的 问题 。 显 然 对 于 任意 两 个 nxn 和 矩 
阵 A 和 B 来 说 ,用 计算 A+B 的 算法 中 的 数量 加 法 次 数 表示 的 运行 时 间 总 是 相同 
的 。 也 就 是 说 ,算法 的 运行 时 间 和 输入 的 值 无 关 , 而 只 与 用 元 素数 目测 度 的 大 小 有 
关 。 这 与 插入 排序 算法 一 类 的 算法 相反 ,后 者 的 运行 时 间 在 很 大 程度 上 与 输入 值 
有 关 。 在 合并 排序 算法 中 ,输入 大 小 为 ” 的 数组 中 ,执行 的 元 素 比较 次 数 在 n 一 1 
和 n(n 一 1) 旬 之 间 。 这 表明 算法 的 执行 不 仅 是 n 的 函数 ,也 是 输入 元 素 初始 顺 
序 的 函数 。 算 法 运行 时 间 不 仅 依 赖 于 输入 数据 的 个 数 , 还 依赖 于 它 的 形式 ,这 是 许 
多 问题 的 特征 。 例 如 ,排序 过 程 内 在 的 与 被 排序 数据 的 相对 次 序 有 关 。 但 并 不 是 
说 所 有 的 排序 算法 都 受 输入 数据 的 影响 ,比如 说 不 管 输入 值 的 顺序 或 形式 怎样 , 插 
人 排序 算法 对 大 小 为 n 的 数组 执行 的 元 素 比较 次 数 都 是 相同 的 ,这 是 由 于 算法 执 
行 的 元 素 比较 次 数 仅仅 是 ”的 函数 。 更 精确 地 说 ,用 基于 比较 的 算法 对 ”个 元 素 
的 集合 排序 , 它 用 的 时 间 依赖 于 元 素 间 相 对 的 顺序 ,例如 ,对 6,3,4,5,1,7,2 这 些 
数 排序 ,需要 的 步 数 和 对 60,30,40,50,10,70,20 排序 的 步 数 相同 。 显 然 , 不 可 能 
找到 一 个 与 输入 大 小 和 形式 都 相关 的 描述 算法 时 间 复 杂 性 的 函数 ,后 一 因素 只 能 
被 忽略 。 

再 来 看 插入 排序 算法 , 令 A[1…n] = 11,2,…,n|, 考 虑 A 中 元 素 的 所 有 1 
排列 ,每 个 排列 都 对 应 一 个 可 能 的 输入 。 对 两 个 不 同 排列 ,算法 的 运行 时 间 可 认为 





@ 有 关 一 分 法 搜索 算法 的 内 容 请 参阅 计算 机 数据 结构 相关 方面 的 书籍 ,这 里 不 再 进行 详细 的 论述 。 
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是 不 同 的。 考虑 3 个 排列 :排列 a ,数组 A 中 的 元 素 已 按 降 序 排 列 ; 排 列 5, 数组 A 
中 的 元 素 为 随机 顺序 ;排列 ,数组 A 中 的 元 素 已 按 升序 排列 (图 1.2)。 


运行 时 间 





(1,0) 输入 大 小 
图 1.2 插入 排序 算法 的 性 能 ;最 坏 情况 平均 情况 和 最 好 情况 


这 样 ,输入 a 代表 了 大 小 为 n 的 所 有 输入 中 最 坏 的 情况 ;输入 。 代表 最 好 的 
情况 ;输入 5 居 二 者 之 间 。 这 产生 了 分 析 算 法 运行 时 间 的 三 种 方法 :最 坏 情况 分 
析 、 平 均 情况 分 析 和 最 好 情况 分 析 。 


1. 最 坏 情 况 分 析 


在 时 间 复 杂 性 的 最 坏 情况 分 析 中 ,我 们 在 所 有 大 小 为 n 的 输入 中 选择 代价 最 
大 的 ,如 前 面 所 述 , 对 任何 一 个 正 整数 ,插入 排序 算法 需要 Q (2) 来 处 理 大 小 为 
n 的 某 一 输入 (图 1.2 中 的 输入 a )。 由 于 这 个 原因 ,我 们 说 在 最 坏 情 况 下 该 算法 
的 运行 时 间 是 Q(n*)。 由 于 运行 时 间 是 O(n?) ,那么 我 们 也 说 算法 在 最 坏 情 况 下 
的 运行 时 间 是 O(n?*) ,因此 使 用 更 强 的 9 符号 ,该 算法 在 最 坏 情 况 下 算法 的 运行 
时 间 是 @(n?*)。 显 然 @ 符号 是 几 个 当中 最 合适 的 ,因为 它 给 出 了 算法 在 最 坏 情 况 
下 的 确切 性 能 。 换 名 话说, 称 插 人 排序 算法 在 最 坏 情况 下 运行 时 间 是 6(n?) 也 药 
含 了 该 算法 在 最 坏 情况 下 运行 时 间 是 Q(xn?), 但 说 该 算法 在 最 坏 情 况 下 运行 时 间 
是 O(n?) 就 没有 这 层 含义 。 注 意 对 任何 ,都 能 找到 输入 的 实例 ,对 于 这 一 实例 ， 
算法 的 运行 时 间 不 超过 O(n)( 图 1.2 中 的 输入 c)。 

由 此 可 见 , 在 最 坏 情况 假设 下 ,许多 算法 的 上 下 界 合 一 ,因此 可 以 说 算法 在 最 
坏 情 况 下 以 @(f(n)) 运 行 。 上 面 已 经 解释 过 ,这 比 说 算法 在 最 坏 情况 下 是 
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O(f(n)) 更 强 。 

有 人 试图 得 出 这 样 的 结论 ,在 最 坏 情况 下 ,上 下 界 的 概念 总 会 重合 ,然而 实际 
情况 不 是 这 样 。 考 虑 一 个 在 最 坏 情 况 下 运行 时 间 是 O(n?) 的 算法 的 例子 ,我 们 还 
不 能 证 明 对 于 所 有 大 于 某 个 阔 值 no 的 值 ,都 存在 一 个 大 小 为 ”的 输入 ,对 于 这 
个 输入 ,算法 要 用 的 时 间 为 0(n*)。 在 这 种 情况 下 ,即使 我 们 知道 算法 对 于 的 
无 限 多 个 值 用 了 B (nn?*) 的 时 间 , 也 不 能 说 该 算法 在 最 坏 情况 下 的 运行 时 间 是 
9(2)。 在 许多 图 和 网 络 算法 中 有 这 样 的 情况 , 仅 可 以 证 明 运 算数 目 有 一 个 上 界 ， 
而 这 个 上 界 是 否 能 达到 却 不 清楚 。 


2. 平均 情况 分 析 


另 一 个 对 算法 时 间 复 杂 性 的 解释 是 平均 情况 。 这 里 运行 时 间 是 指 在 所 有 大 小 
为 n 的 输入 的 平均 时 间 ( 图 1.2 )。 在 这 种 方法 里 ,必须 知道 所 有 输入 出 现 的 概 
率 ,也 就 是 需要 预先 知道 输入 的 分 布 。 然 而 在 许多 情况 下 ,即使 放宽 了 一 些 约束 ， 
包括 假设 有 一 个 理想 的 输入 分 布 (如 均匀 分 布 ) ,分 析 也 是 复杂 和 元 长 的 。 


1.5.3 平 挫 分 析 


在 许多 算法 中 ,也 许 无 法 用 9 符号 表达 时 间 复 杂 性 以 得 到 一 个 运行 时 间 的 确 
界 ,这 样 ,我 们 将 满足 于 O 符号 ,在 某 些 时 候 , 上 界 是 过 高 了 。 如 果 用 O 符号 得 到 
运行 时 间 的 上 界 ,那么 即使 在 最 坏 情况 下 ,算法 可 能 也 比 我 们 佑 计 的 要 快 得 多 。 

考虑 这 样 一 个 算法 ,在 算法 中 有 一 种 运算 反复 执行 时 有 这 样 的 特性 : 它 的 运行 
时 间 始 终 变 动 。 如 果 这 一 运算 在 大 多 数 时 候 运行 得 很 快 ,只 是 偶尔 要 花 大 量 时 间 ， 
又 假定 求 确 界 虽 然 可 能 ,但 是 非常 困难 ,那么 这 就 预示 要 用 平 挫 分 析 了 。 

在 平 挫 分 析 中 ,可 以 算出 算法 在 整个 执行 过 程 中 所 用 时 间 的 平均 值 , 称 为 该 运 
算 的 平 推 运行 时 间 。 平 瓜分 析 保 证 了 运算 的 平均 代价 ,进而 也 保证 了 算法 在 最 坏 
情况 下 的 平均 开销 。 这 与 平均 时 间 分 析 不 同 ,在 平均 时 间 分 析 中 ,要 计算 同样 大 小 
的 所 有 实例 才能 得 到 平均 值 , 它 也 不 像 平 均 情 况 分 析 , 不 需要 假设 输入 的 概率 分 
布 。 一 般 来 说 , 平 摊 时 间 分 析 比 最 坏 情况 分 析 更 困难 ,但 是 当 我 们 由 此 导出 了 一 个 
更 低 的 时 间 复 杂 性 时 ,克服 这 些 困难 就 值得 了 。 


1.5.4 输入 大 小 各 问题 实例 
一 个 算法 执行 性 能 的 测度 通常 是 它 输 入 的 大 小 .顺序 和 分 布 等 的 函数 。 其 中 


最 重要 的 ,也 是 我 们 最 感 兴 趣 的 是 输入 的 大 小 。 用 图 灵机 作为 计算 模型 ,能 方便 地 
以 非 空 单元 的 数目 测量 算法 输入 的 大 小 。 如 果 想 要 用 数字 、 顶 点 线段 和 其 他 对 象 
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来 描述 我 们 研究 现实 世界 中 的 问题 ,当然 是 不 切实 际 的。 由 于 这 个 原因 ,输入 大 小 
的 概念 属于 算法 分 析 的 实践 部 分 ,并 且 对 它 的 解释 已 成 为 约定 俗 成 。 当 讨论 一 个 
相对 于 一 个 算法 的 问题 时 ,我 们 通常 谈 一 个 问题 的 实例 。 于 是 ,一 个 问题 的 实例 就 
转变 为 求解 该 问题 的 一 个 算法 的 输入 。 例 如 ,我 们 把 ”个 整数 的 数组 A 称 为 对 数 
排序 问题 的 一 个 实例 ,同时 ,在 讨论 插入 排序 算法 的 时 候 ,我 们 把 这 个 数组 看 作 算 
法 的 输入 。 

输入 的 大 小 作为 一 个 数量 ,不 是 输入 的 精确 测度 , 它 解释 为 从 属于 已 设计 或 将 
要 设计 的 算法 的 问题 。 一 些 常用 的 、 作 为 常用 输入 大 小 的 测度 如 下 : 

(1) 在 排序 和 搜索 问题 中 ,用 数组 或 表 中 元 素 的 数目 作为 输入 大 小 ; 

(2) 在 图 的 算法 中 ,输入 大 小 通常 指 图 中 的 边 或 顶点 的 数目 ,或 二 者 丝 有 ; 

(3) 在 计算 风 何 中 ,算法 的 输入 大 小 通常 用 点 、 顶 点 、 边 、 线 段 或 多 边 形 等 的 个 
数 来 表示 ; 

(4) 在 矩阵 运算 中 ,输入 大 小 通常 是 输入 矩阵 的 维 数 ; 

(5) 在 数论 算法 和 密码 学 中 ,通常 选择 输入 的 比特 数 来 表示 它 的 长 度 , 当 一 个 
字 由 固定 的 比特 数组 成 时 ,一 个 数字 的 字数 也 可 以 选 来 表示 输入 的 长 度 。 

这 些 “ 不 单一 的 "测度 方法 在 比较 两 个 算法 所 需 的 时 间 和 空间 时 会 带 来 一 些 不 
一 致 性 。 例 如 ,将 两 个 x x n 的 矩阵 相 加 的 算法 要 执行 n? 次 加 法 ,看 上 去 是 平方 
的 关系 ,而 实际 上 与 输入 的 大 小 关系 却 是 线性 的 。 


思 考题 


1. 简 述 算法 的 时 间 复 杂 性 度量 。 
2. 简 述 算法 的 空间 复杂 性 度量 。 
3. 简 述 算法 的 评价 策略 。 
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2.1 维 数 扩展 的 9 交集 模型 


2.1.1 概 述 


关系 运算 是 指 用 于 检验 两 个 几何 对 象 的 特定 的 拓扑 空间 关系 的 逻辑 方法 。 两 
个 几何 对 象 的 拓扑 空间 关系 在 GIS 中 是 一 个 重要 的 研究 主题 。 两 个 几何 对 象 拓 
扑 空间 关键 关系 最 基本 的 比较 方法 就 是 成 对 比较 两 个 几何 对 象 的 内 部 .边界 和 外 
部 的 交集 ,并 基于 交集 矩阵 产生 的 实体 来 对 两 个 几何 对 象 空间 关系 分 类 。 

普通 拓扑 学 很 好 地 定义 了 内 部 .边界 和 外 部 的 概念 。 这 些 概 念 适 用 于 在 二 维 
空间 中 二 维 对 象 的 空间 关系 的 定义 。 这 些 概念 要 适用 于 二 维 空间 中 的 一 维和 零 维 
对 象 时 ,需要 组 合 拓扑 学 方法 。 组 合 拓扑 学 方法 是 基于 简单 复合 体 的 内 部 .边界 和 
外 部 的 定义 基础 上 产生 的 ,结果 如 下 : 

几何 体 的 边界 由 一 组 较 低 维 数 的 几何 体 构成 。 点 (Point) 或 多 点 (MultiPoint) 
的 边界 为 一 个 空 集 。 非 闭合 曲线 的 边界 由 其 两 个 端点 组 成 ,闭合 曲线 的 边界 为 空 。 
多 曲线 (MultiCurve) 的 边界 为 它 的 组 成 弧 段 的 奇数 弧 段 构成 。 多 边 形 边界 是 其 环 的 
集合 。 多 多 边 形 (MultiPolygon) 的 边界 是 组 成 它 的 多 边 形 的 环 的 集合 。 任 意 几何 体 
组 合 其 内 部 是 利用 “mod 2” 相 交 法 则 从 单元 几何 体 边界 抽取 的 不 连续 的 几何 体 。 

几何 对 象 域 通常 认为 是 拓扑 闭合 的 。 组 成 几何 体内 部 的 点 不 会 因为 其 外 部 的 
点 被 删除 而 删除 。 组 成 几何 体外 部 的 点 不 在 几何 体内 部 或 者 边界 上 。 

最 大 维 数 在 一 维和 二 维 空间 中 两 个 几何 体 的 空间 关系 研究 一 般 只 考虑 对 比 内 
部 和 边界 的 交集 ,并 定义 这 种 情况 为 4 交集 模型 。 当 该 模型 考虑 到 输入 几何 体 的 
.外 部 时 就 扩展 为 9 交集 模型 ,同时 ,进一步 加 人 扩展 为 维 数 上 扩展 的 9 交集 模型 的 
产生 的 成 对 的 交集 结果 的 维 数 信息 。 这 些 扩 展 使 得 模型 可 以 表达 点 、 线 、 面 ,以 及 
有 洞 和 多 线 、 多 面 的 面 的 空间 关系 。 


2.1.2 模型 介绍 


几何 体 a ,假设 I(a)、B(a) 和 Ea) 分 别 表示 a 的 内 部 边界 和 外 部 。I(a)、 
B(a) 和 E(a) 任 意 两 个 的 交集 就 生成 一 个 混合 维 数 的 几何 体 集合 zx。 例如 ,两 个 
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多 边 形 的 边界 交集 可 以 由 一 个 点 和 一 条 线 组 成 。 假 设 dim(z) 返 回 z 中 的 几何 体 
的 最 大 维 数 为 ( -1,0,1,2), 一 1 相应 表示 dim(g)。 维 数 扩展 的 9 交集 矩阵 (DE- 
9IM) 则 推出 以 下 公式 ( 表 2.1): 





表 2.1 DE-9IM 
项 目 内 部 边界 外 部 
内 部 dim(I(a) 门 IC6)) dim(I(a)f\B(6)) dim(I(a)NE(6)) 
边界 dim(B(a)mI(6)) dim(B(a) |B(6)) dim(B(a) NE(6)) 
外 部 dim(E(a)NI(6)) dim(E(a) 门 B(O)) dim(E(a) 门 E(5)) 


通常 ,例如 计算 两 个 闭合 的 正 多 边 形 的 交集 内 部 并 确定 交集 的 维 数 ,就 没有 必 
要 分 别 用 几 个 几何 体 表 示 两 个 多 边 形 (两 者 为 拓扑 开放 集 ) 内 部 。 大 多 数 情 况 下 ， 
每 一 单元 交集 的 维 数 都 严格 受到 两 个 几何 体 类 型 的 限制 。 比 如 , 线 - 面 关系 中 ,内 
部 -内 部 单元 的 维 数 只 可 能 是 | -1,1| 而 面 - 面 关 系 中 内 部 -内 部 单元 的 维 数 为 
| -1,21。 在 以 上 情况 中 所 需要 做 的 只 是 寻找 交集 。 

图 2.1 为 多 边 形 a 和 6 准 置 的 DE-9IM 表示 。 











2 1 2 
1 0 1 
2 1 2 


图 2.1 DE-9IM 模型 示例 


空间 关系 的 描述 可 以 归纳 为 :两 个 几何 体 ,以 表示 两 个 几何 体 DE-9IM 结果 合 
理 值 集合 的 模式 矩阵 形式 输入 。 只 要 两 个 几何 体 的 空间 关系 符合 模式 矩阵 表示 的 
合理 值 中 的 一 个 , 则 返回 TRUE。 

模式 矩阵 由 9 种 模式 - 值 集合 构成 ,一 种 集合 对 应 矩阵 一 个 单元 。 可 能 的 模式 
值 p 为 {T,F, * ,0,1,2}, 对 于 任何 单元 的 所 属 何 种 交集 含义 x 如 下 : 

p=T 之 dim(z) €10,1,2) ,例如 ,x 关 $ 

p=F 祝 dim(z)= 一 1, 例 如 ,z=#$ 

p=* 之 dim(z) € {~-1,0,1,2|, 例 如 ,没关系 
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p=0> dim(zx)=0 

p=1=> dim(z)=1 

力 =2 之 dim(z)=2 

模式 矩阵 可 以 用 一 个 以 行 号 为 顺序 的 9 个 元 素 的 数组 或 者 列表 表示 。 如 下 例 
所 示人 代码 用 于 检测 两 个 区 域 是 否 释 置 ; 


char x* overlapMatrix= ‘T*T***T**?’,; 
Geometry * a,b; 
Boolean b=a—>Relate(b, overlapMatrix); 


2.1.3 ”空间 关系 的 判定 


基于 模式 和 矩 阵 的 空间 关系 的 确定 使 得 用 户 可 以 检测 大 部 分 的 空间 关系 ,并 能 
对 特殊 的 空间 关系 进行 检测 。 可 仍然 存在 缺点 ,模式 矩阵 只 是 抽象 化 的 语言 而 非 
人 性 化 的 语言 。 除 了 熟悉 空间 关系 GIS 开发 者 以 外 , 某 些 用 户 希 望 使 用 更 为 人 性 
化 的 语言 ,如 “select all features“spatially within”a query polygon ” 。 

为 了 满足 这 些 用 户 的 需要 ,定义 了 一 系列 用 于 DE-9IM 的 空间 关系 命名 。 这 
五 种 分 别 是 相 离 相 接 、 相 交 、 真 包含 和 秋 置 。 这 些 命名 的 定义 如 下 所 示 。 在 这 些 
定义 中 PP 用 于 表示 零 维 的 几何 体 (点 和 多 点 ),L 表示 一 维 几 何 体 (LineStrings and 
MultiLineStrings) ,而 A 则 表示 二 维 几何 体 ( 面 和 多 面 )。 


1. 相 离 (Disjoint) 


假设 两 个 几何 体 (闭合 )a 和 2: 
. a.Disjoint(6)SafNb=$ 
DE-9IM 中 表示 为 
a .Disjoint(86)SO(I(a) N12)= 28) A (I(a) NB(L)=2) A (B(a) 
1(5)=@2) A (Bl(a) mm B(b)= 2) 
Oa .Relate(b, ‘FF*FF****’) 


2. 相 接 (Touches) 


两 个 几何 体 a 和 6 相 接 关系 适用 于 A/A,L/L,L/A,P/A 和 PXL ,而 不 适 
用 于 P/P。 其 定义 如 下 : 

a.Touches(8) SS (I(a)fNI(5)= 8) A (a Nf 26) 天 好 

DE-9IM 中 表示 为 

a.Touches(8) © (I(a)NNI(6)=2) A ((B(a) MN I1(6) GG) V (I(a) 站 
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B(5) 天 好 ) V (BCc) 门 B(2) 天 他)) 

Oa.Relate(b, ‘FT*******’) V a.Relate(b, ‘F**T*****’) Va.Relate(b, 
的 ad Bd ”) 

图 2.2 为 相 接 关系 的 示例 。 


多 边 形 / 多 边 形 





图 2.2 相 接 关系 示例 


3. 相交 (Crosses) 


相交 关系 适用 于 P/L,P/A ,L/L 和 L/A 的 情况 。 定 义 如 下 : 

a .Crosses(6) © (dim(I(a) ff} 1(5)) < max(dim(I(a)),dim(I(65)))) A 
(a | ba) A (a Nb 6) 

DE-9IM 中 表示 为 

CaseaE P,bpE LorCasea EE€ PbLE AorCaseaE LbEA: 

a.Crosses(6) © (I(a) (| I(4) 天 好) A (I(a) f) E(6) #2) SO a.Relate 
(8 eTeTesxxxey) 

CaseaE€ L,bEL: 

a .Crosses(6) © dim(I(a)f\I(b))=0 © a.Relate(6, ‘0********’), 

图 2.3 为 相交 示例 。 


多 边 形 / 线 线 / 线 





图 2.3 相交 关系 示例 
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4. 真 包含 (Withins) 


真 包含 关系 定义 如 下 

a.Within(8) SO (a M1 5=a) A (I(a) (NI(2) 0) 

DE-9IM 中 表示 为 

a.Within(b8) ©S (I(a)fNI(b)AG) A (I(a) NNE(L) = 2) A (Bl(a)fN 
E(b) = 人 好) SO a.Relate(b,'T*F PF***’) 

图 2.4 为 真 包含 示例 。 


多 边 形 /多 边 形 





多 边 形 / 线 





图 2.4 真 包含 关系 示例 


5. 到 置 (Overlaps) 


笃 置 关系 定义 的 情况 为 A/A,L/L 和 P/P。 

定义 如 下 

a .Overlaps(6) © (dim(I(a))=dim(I(6))=dim(I(a) MMI(5))) A(afib 
关 a)A (ab 6) 

DE-9IM 中 表示 为 | 

Casea EP,bE PorCaseaE A,bEA: 

a .Overlaps(b) SO (I(a) 站 IC) 天 好) A (I(a) NE(L)AG) A (E(a) NN 
I(b)AG) SO a.Relate(b, ‘T*T”***T**’) 

Casea€E€  L,bEL: 

a .Overlaps(b) ©S (dim(I(a) (NI(5))=1) A (I(a)fNE(6)AG) A (E(a) 
NI(6)AG) SO a.Relate(b, 1 T***T**’) 

图 2.5 为 倒置 关系 示例 。 


6. 包含 (Contains) 


a .Contains(8) © 6b.Within(a) 
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e2 





图 2.5 又 置 关 系 示 例 


7. 相交 (Intersects) 
a. Intersects(6) ©! a.Disjoint(6) 
总 结 上 面 的 论述 ,可 得 DE-9IM 模板 , 见 表 2.2。 
表 2.2 DE-9IM 模板 分 析 












DE-9IM 模板 
FE* FE 


空间 关系 
相 离 (Disjoint) 





























L/L FT 或 
相 接 (Touches) L/A FT 或 
p/A Err Tr 
Ea 
P/L 
P/L 
gd i 
P/A 
相交 (Crosses) | 
L/L Or 
L/A i We 








ER 


T*F**F*** 
T*T***T** 


真 包含 (Within) 




























释 置 (Overlaps) 人 

TT To 
包含 (Contains) a .Contains(b)—b .Within(a) 
相交 (Intersects) a. Intersects(6)—1a .Disjoint( 4b) 











相等 (Equals) 
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2.2 矢量 的 概念 
如 果 一 条 线段 的 端点 是 有 次 序 之 分 的 ,我 们 把 这 种 线段 成 为 有 向 线段 (direct- 


ed segment) 。 如 果 有 向 线段 pi1p; 的 起 点 pi 在 坐标 原点 ,我 们 可 以 把 它 称 为 矢量 
P2( 图 2.6)。 


图 2.6 矢量 的 概念 


2.2.1 矢量 加 减法 


设 二 维 矢 量 P= (zi, yi1),Q= (zz,y2), 则 矢量 加 法 定义 为 P+Q= (zit+ 
z2y+ y2)( 图 2.7); 同 样 地 ,矢量 减法 定义 为 P-Q= (xi zx2, 1 一 »2) 
(图 2.8)。 显 然 有 性 质 P+Q=Q+P,P-Q=-(Q-P)。 
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2.2.2 矢量 又 积 


计算 矢量 叉 积 是 与 直线 和 线段 相关 算法 的 核心 部 分 。 设 矢量 已 = (zi, yl)， 
Q=(zay), 则 矢量 又 积 定义 为 由 (0,0)、 pi zz 和 pip2 所 组 成 的 平行 四 边 形 的 
带 符号 的 面积 , 即 :PX Q= zx1 .y2 一 x2 .yi 其 结果 是 一 个 标量 。 显 然 有 性 质 P x 
Q=-(QxP) 和 Px(-Q)=-(PxQ)。 一 般 在 不 加 说 明 的 情况 下 ,本 文 所 述 
算法 中 所 有 的 点 都 看 作 矢量 ,两 点 的 加 减法 就 是 矢量 相 加 减 ,而 点 的 乘法 则 看 作 矢 
量 又 积 。 

叉 积 的 一 个 非常 重要 的 性 质 是 可 以 通过 它 的 符号 判断 两 矢量 相互 之 间 的 顺 逆 
时 针 关 系 : 

若 PxQ>0, 则 P 了 在 Q 的 顺 时 针 方 向 ; 

若 PxQ<0, 则 己 在 Q 的 逆 时 针 方 向 ; 

着 PxQ=0, 则 PP 与 Q 共 线 , 但 可 能 同 向 也 可 能 反 向 。 


2.3 ”折线 段 的 拐 向 判断 
折线 段 的 拐 向 判断 方法 可 以 直接 由 矢量 叉 积 的 性 质 推出 。 对 于 有 公共 端点 的 线 
段 popt 和 p12, 通 过 计算 (ps po) x (pi 一 加 ) 的 符号 便 可 以 确定 折线 段 的 拐 向 : 


p> 


po po 
车 (p2-po) X (pi1-po)<0, 则 popl 车 (ps-po)X (pi1-po)=0, 
在 pi 点 拐 向 左 侧 后 得 到 PP 则 po、pi、P2 三 点 共 线 


pi 


po 
车 (ps-po) Xx (p1-po)>0, 则 pop! 
在 Pi 点 拐 向 右 侧 后 得 到 PP 


图 2.9 折线 段 的 拐 向 判断 
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车 (ps 一 po)X(pi1 一 po)>>0, 则 popi 在 pi 点 拐 向 右 侧 后 得 到 pip，; 
车 (ps 一 p0)X(pi 一 po)<0, 则 popi 在 pi 点 拐 向 左 侧 后 得 到 p1ps; 
若 (p2 一 po)X(p1 一 po)=0, 则 po、p1、p2 三 点 共 线 。 . 
具体 情况 可 参照 图 2.9。 


2.4 判断 点 是 否 在 线段 上 


设 点 为 Q ,线段 为 PiP2 ,判断 点 Q 在 该 线段 上 的 依据 是 :(Q - Pi) x (了 P, - 
Pi)=0 且 Q 在 以 Pi、P; 为 对 角 顶 点 的 矩形 内 。 前 者 保证 Q 点 在 直线 P1P， 上 ， 
后 者 是 保证 Q 点 不 在 线段 PiP 的 延长 线 或 反 向 延长 线 上 ,对 于 这 一 步骤 的 判 渐 
可 以 用 以 下 过 程 实现 : 

if (min(Pix, Pyx)SQ Smax(Piy, Pox)) 

and (min(Piy,P2y) 委 Q 委 max min(Piy, Poy)) 
then return true; 


else return false; 


特别 要 注意 的 是 , 由 于 需要 考虑 水 平 线段 和 垂直 线段 两 种 特殊 情况 ， 
min( Pi;, Pj ) 夺 Q;max( Pi;, P2;, ) 和 和 min( Piy, P2y) Qi 三 max( 了 Piy, P2y) 两 
个 条 件 必须 同时 满足 才能 返回 真 值 。 


2.5 判断 两 线段 是 否 相 交 
1. 算法 一 
我 们 分 两 步 确定 两 条 线段 是 否 相交 : 
1) 快速 排斥 试验 


设 以 线段 P; P; 为 对 角 线 的 矩形 为 R, 设 以 线段 Q1Q; 为 对 角 线 的 矩形 为 工 ， 
如 果 R 和 本 不 相交 ,显然 两 线段 不 会 相交 。 


2) 跨 立 试验 


如 果 两 线段 相交 , 则 两 线段 必然 相互 跨 立 对 方 。 若 PiP; 跨 立 Qi1Q;, 则 矢量 
(Pi- Qi) 和 (Ps 一 Q1) 位 于 矢量 (Qs 一 Qi) 的 两 侧 , 即 (Pi 一 Qi1) Xx (Qi Qi) Xx 
(P; 一 Qi1)X(Q 一 Qi1)<0。 上 式 可 改写 成 (Pi 一 Qi1) XxX(Q; 一 Q1) Xx(Q; 一 Q1) 
x(P; 一 Qi1)>0。 当 (Pi 一 Qi1)Xx(Q2 一 Qi1)=0 时 ,说 明 (Pi 一 Qi) 和 (QQ, 一 Qi1) 
共 线 ,但 是 因为 已 经 通过 快速 排斥 试验 ,所 以 Pi 一 定 在 线段 QiQ: 上 ; 同 理 ， 
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(Q; 一 Q1)X(P, 一 Qi1)=0 说 明 P, 一 定 在 线段 QiQz 上 。 所 以 判断 PiP, 跨 立 
QiQ: 的 依据 是 :(Pi 一 Q1) X(Q;2 一 Q1)X (Qs 一 Q1) Xx (Ps 一 Qi1) 之 0。 同 理 判 断 
Q1Q; 跨 立 PiP; 的 依据 是 :(Q1 一 Pi) x(P;,- Pi)x(P:-P)x(Qz-Pi) 二 0。 
具体 情况 如 图 2.10 所 示 。 


区 通过 快速 排斥 试验 未 通过 快速 排斥 试验 





图 2.10 判断 两 线段 是 否 相交 


2. 算法 二 


定义 A,B,C,D 为 二 维 空间 的 点 , 则 有 向 线段 AB 和 CD 的 参数 方程 为 
AB= A+r(B-A),r€ [0,1] 
CD= C+s(D-C),s € [0,1] 
如 果 AB 与 CD 相交 , 则 
A+r(B-A)= C+;s(D-C)>Ar+r(Br - Ar) = Cr + s(Dzr - Cr), 
Ay+r(By— Ay) = Cy+ s(Dy — Cy),r,s € [0,1] 
解 方程 , 求 > 和 ;: 
(Ay — Cy)(Dzr - Cr) ~ (Ar - Cx)(Dy — Cy). 
(Br - Azx)(Dy— Cy) - (By - Ay)(Dzr - Cz) 
_(Ay- Cy)(Br ~ Ar)- (Ar - Cr)(By - Ay) 
(Bx - 4Azr)(Dy - Cy) - (By - Ay)(Dzr - Cx) 
设 已 为 直线 4AB 和 CD 的 交点 , 则 
P=A+r(B-A)>Pr = Art+r(Br -Azr),Py= Ay+r(By— Ay) 
如 果 (0 委 r 科 and(0 委 * 科 1) , 则 有 向 线段 AB 和 CD 的 交点 存在 ,否则 交点 
不 存在 。 
如 果 (Bz -4z)(Py-Cy)-(By-A4y)(Dz- Cz) 为 0, 则 4B 和 CD 平行。 
如 果 (4y- Cy)(Pr -Crz)-(4z-Cr)(Dy-GCzr) 也 为 0, 则 4B 与 CD 共 线 。 
如 果 直 线 AB 和 CD 相交 ,而 交点 不 位 于 线段 AB 和 CD 之 间 , 则 交点 位 置 可 
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以 通过 如 下 条 件 进 行 判断 ， 
如 果 xr>1, 则 了 位 于 有 向 线段 AB 的 延长 线 上 ; 
如 果 r<0, 则 了 位 于 有 向 线段 BA 的 延长 线 上 ; 
如 果 s>1, 则 了 位 于 有 向 线段 CD 的 延长 线 上 ; 
如 果 ;<0, 则 了 P 位 于 有 向 线段 DC 的 延长 线 上 。 


2.6 判断 矩形 是 否 包含 点 
只 要 判断 该 点 的 横 坐 标 和 纵 坐标 是 否 夹 在 矩形 的 左右 边 和 上 下 边 之 间 。 
2.7 判断 线段 .折线 .多边形 是 否 在 矩形 中 
因为 矩形 是 个 凸 集 , 所 以 只 要 判断 所 有 端点 是 否 都 在 矩形 中 就 可 以 了 。 
2.8 判断 矩形 是 否 在 矩形 中 
只 要 比较 左右 边界 和 上 下 边界 就 可 以 了 。 
2.9 判断 圆 是否 在 矩形 中 


很 容易 证 明 , 圆 在 矩形 中 的 充 要 条 件 是 :圆心 在 矩形 中 是 圆 的 半径 小 于 或 等 于 
圆心 到 矩形 四 边 的 距离 的 最 小 值 。 


2.10 判断 点 是 否 在 多 边 形 内 


判断 点 卫 是 否 在 多 边 形 中 是 计算 几何 中 一 个 非常 基本 但 是 十 分 重要 的 算法 。 
对 这 个 问题 有 许多 令 人 感 兴趣 的 算法 。 两 个 常用 的 算法 如 下 (图 2.11) :中 射线 
法 。 一 条 射线 从 点 PP 开始 , 穿 过 多 边 形 的 边界 的 次 数 称 为 交点 数目 。 当 交点 数目 
是 偶数 时 ,点 已 在 多 边 形 外 部 ;否则 ,为 奇数 时 ,在 多 边 形 内 部 。 这 个 方法 有 时 称 
为 “奇偶 ”测试 法 。@@ 转 角 法 。 多 边 形 环 绕 点 P 的 次 数 称 为 环绕 数 。 环 绕 数 为 零 
时 ,点 P. 在 多 边 形 外 部 ;否则 在 多 边 形 内 部 。 

如 果 多 边 形 是 简单 的 (没有 自 相交 点 ) ,那么 两 个 方法 对 所 有 的 点 都 会 给 出 相 
同 的 结果 。 但 是 ,对 于 非 简单 多 边 形 ,两 个 方法 对 一 些 点 有 不 同 的 结果 。 例 如 , 当 
多 边 形 自身 重要 时 ,在 重要 区 域内 部 的 点 如 果 用 射线 法 方法 测试 会 发 现 结果 为 点 
在 多 边 形 外 部 ;而 用 转角 法 方法 测试 结果 为 点 在 多 边 形 内 部 。 
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(a) 射线 法 (b) 转角 法 
节点 序号 : 0123456789 


图 2.11 点 在 多 边 形 内 的 判断 比较 


在 这 个 例子 中 ,重合 区 域 中 的 点 的 环绕 数 为 2, 表 明 在 多 边 形 内 部 两 次 。 很 明 
显 ,环绕 数 方法 比 射线 法 给 出 了 更 好 的 管 案 。 

尽管 如 此 ,射线 法 还 是 被 很 普遍 地 使 用 ,因为 交点 数目 被 认为 比 环绕 数 更 高 效 
( 快 20 倍 )。 但 事实 不 是 这 样 的 ,环绕 数 可 以 和 交点 数 一 样 高 效 。 


2.10.1 射线 法 


这 个 方法 计算 从 点 了 开始 的 射线 穿 过 多 边 形 边界 的 次 数 , 多 边 形 的 边界 将 多 
边 形 分 为 内 部 和 外 部 。 如 果 是 偶数 ,那么 点 在 多 边 形 外 部 ;否则 ,若是 奇数 ,那么 在 
多 边 形 内 部 。 这 个 方法 从 直觉 上 很 容易 理解 。 每 次 射线 穿 过 多 边 形 的 一 个 边 , 它 
的 出 和 人 特性 改变 了 。 最 终 ,任何 射线 都 穿 出 多 边 形 。 因 此 ,如 果 点 在 多 边 形 的 内 
部 ,那么 穿越 边界 (“一 ”) 的 次 序 是 :in 一 out 一 … 一 in 习 out, 并 且 穿 越 的 次 数 为 奇 
数 。 同 样 ,如 果 点 在 外 部 ,总 的 穿越 次 数 为 偶数 次 ,out->… 一 inr>out( 图 2.12)。 

















图 2.12 射线 法 


在 实现 交点 数 的 算法 中 ,我们 必须 确保 只 有 会 改变 出 人 特性 的 穿越 才 被 计算 。 
特别 是 , 有些 特殊 的 情况 下 射线 会 经 过 顶点 , 这 时 必须 要 进行 适当 的 处 理 。 
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图 2.13 展 示 了 一 些 类 型 的 射线 穿越 情况 。 





图 2.13 射线 穿越 的 特殊 情况 


进一步 ,我 们 必须 决定 在 多 边 形 边界 上 的 点 是 在 多 边 形 内 部 还 是 外 部 。 一 个 
标准 的 约定 是 在 左边 界 或 下 边界 上 的 点 认为 是 在 多 边 形 内 部 ,在 右边 界 或 上 边界 
的 点 认为 是 在 多 边 形 外 部 。 在 这 种 约定 下 ,如 果 两 个 不 同 的 多 边 形 共享 一 个 公共 
边 ,那么 在 这 条 边 上 的 点 会 在 一 个 多 边 形 的 内 部 而 在 另 一 个 多 边 形 的 外 部 。 这 样 
就 避免 了 在 计算 机 图 形 显示 中 会 出 现 的 一 些 问 题 。 

一 个 简单 的 射线 算法 是 选择 一 条 水 平 的 .向 点 卫 的 右边 延伸 的 、 平 行 于 z 轴 
的 射线 。 使 用 这 条 特别 的 射线 ,很 容易 计算 与 多 边 形 边 的 交点 ,并 且 很 容易 判断 是 
否 有 交点 。 为 了 计算 总 的 交点 的 数目 ,算法 简单 的 遍历 多 边 形 的 所 有 边 ,测试 是 否 
穿越 边 ,穿越 时 增加 交点 的 数目 。 另 外 ,穿越 测试 必须 处 理 好 一 些 特殊 的 情形 。 完 
全 的 规则 如 下 : 

(1) 方向 向 上 的 边 包 括 其 开始 点 ,不 包括 其 终止 点 ; 

(2) 方向 向 下 的 边 不 包括 其 开始 点 ,包括 其 终止 点 ; 

(3) 水 平 边 不 参与 穿越 测试 ; 

(4) 射线 和 多 边 形 的 边 的 交点 必须 严格 在 点 P 的 右边 。 

用 这 些 规则 处 理 特殊 情况 ,会 得 出 有 效 的 交点 的 数目 。 规 则 (4) 规 定 了 多 边 形 
右边 界 上 的 点 在 多 边 形 外 部 ,在 左边 界 上 的 点 在 多 边 形 内 部 。 

这 个 算法 的 代码 是 大 家 熟知 的 ,并 且 边 的 穿越 规则 很 容易 表示 。 多 边 形 表示 
为 其 顶点 数组 V[n +1], 其 中 , V[n] = V[0], 常 采用 的 实现 如 下 : 


typedef struct {int x,y;| Point; 


cn PnPoly( Point P,Point V[],int n ) 

: 
int cn= 0; // the crossing number counter 
// loop through all edges of the polygon 
for (each edge E[i]:V[i]V[i+1] of the polygon) 
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if (E[i] crosses upward ala Rule #1 
|| E[i] crosses downward ala Rule #2) 
{ ， 
if (P.x < x_ intersect of E[i] withy=P.y) // Rule #4 
++ cn; // a valid crossing to the right of P.x 
| 


| 
return (cn&l ) ; // 0 if even (out),and 1 if odd (in) 


| 


注意 到 上 面 算法 中 在 对 是 否 满足 规则 (1) 和 规则 (2) 进 行 判断 的 同时 ,也 排除 
了 规则 (4)。 总 的 来 说 ,简单 的 测试 就 可 完成 许多 工作 ,这 使 算法 更 优雅 。 

但 是 ,射线 方法 的 有 效 性 是 基于 一 个 简单 的 闭合 曲线 将 二 维 平 面 分 成 两 个 相连 
的 部 分 :有 边界 的 “内 部 "和 无 边界 的 “外 部 "。 关 键 点 是 曲线 必须 是 简单 的 (没有 自 相 
交 ) ,否则 平面 会 被 分 成 多 于 两 个 部 分 ,并 且 不 能 保证 穿越 边界 时 不 会 改变 出 人 特性 。 
对 于 一 个 闭合 的 曲线 ,可 能 将 二 维 平面 分 成 多 个 部 分 ,其 中 只 有 一 个 没有 边界 且 在 曲 
线 外 部 的 部 分 。 但 有 边界 的 部 分 可 能 在 曲线 内 部 也 可 能 在 外 部 。 两 个 有 共同 边界 的 
有 边界 部 分 可 能 都 在 曲线 内 部 ,那么 穿越 过 共享 的 边界 并 不 会 改变 出 入 特性 。 


2.10.2 转 角 法 


相反 ,转角 法 能 够 很 精确 地 判定 一 个 点 是 否 在 非 简单 多 边 形 的 内 部 , 如 
图 2.14 所 示 。 它 需要 计算 多 边 形 绕 点 有 多 少 次 。 
当 多 边 形 没有 环绕 点 时 , 即 环绕 数 为 零 , 那 点 在 多 
边 形 外 部 。 更 一 般 地 ,定义 在 二 维 平面 中 某 个 封闭 
曲线 关于 某 点 的 环绕 数 。 令 C(u)= (z(x)， 
y(u)),0u 夺 1 且 C(0)=C(1), 是 二 维 连续 曲 
线 。P 是 不 在 C(u) 上 的 点 。 然 后 , 令 Cr(x) = 
Cl(u) 一 了 为 从 点 P 到 C(w) 的 矢量 ,并 且 它 的 单位 
方向 矢量 为 W(w)= CP(w)/|CP(z)|, 这 给 出 了 
: 一 个 连续 的 从 曲线 C 到 单位 贺 Si 的 映射 ,并 且 
图 2.14 转角 法 W(w) 可 以 表示 为 坐标 形式 W(u)= (cos (w)， 
sin(w)), 其 中 ,(w) 是 正 的 逆 时 针 方 向 的 角 。 环 
绕 数 ( wn ) 就 等 于 W(w) 环 绕 Si 的 次 数 的 整数 部 分 。 这 相当 于 Si 的 同 伦 类 ,可 
以 用 以 下 的 积分 公式 计算 ; 
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ey = 二 | 
wn = 二 d0 = 2 Ou du 


车 曲线 C 是 由 顶点 Vo, V1,…, V, = Vo 构成 的 多 边 形 ( 图 2.14) ,那么 积分 可 
以 简化 为 计算 带 符号 的 角度 的 总 和 。 这 些 角 为 PV; 与 PV;, 1 的 夹 角 。 因 此 ,如 果 
i=angle(PV;, PVi+41) ,那么 就 有 以 下 公式 : 

1 多 1 4 PV;* PViri 
a 六 和 2 8 去 之 areeodl PV; I| PV | 

很 显然 ,这 个 公式 效率 不 高 ,因为 它 使 用 了 很 耗 时 的 arccos 函数 。 但 是 ,简单 
观察 一 下 , 就 可 以 用 更 高 效 的 公式 代替 它 。 在 S1 中 任 取 一 点 Q。 因 为 曲线 
W(w) 环 绕 ,那么 它 可 能 会 多 次 经 过 Q 点 。 当 WW(w) 按 逆 时 针 方 向 经 过 Q 点 时 ， 
记 为 +1 次 , 顺 时 针 经 过 Q 点 时 , 计 为 -1 次 ,那么 次 数 总 和 就 是 WW 环绕 Si 的 次 
数 , 刚 好 等 于 环绕 数 (wn ) 。 

继续 ,我 们 可 以 用 一 个 射线 R,R 的 起 
点 为 P 并 向 Q 方向 延伸 。 那么, R 穿越 曲 
线 C 的 交点 和 玉 经 过 Q 的 点 一 一 对 应 。 
在 数学 上 , 当 R 从 C 的 右边 跨 到 左边 时 ， 
此 次 穿越 为 正 的 ;从 左边 跨 到 右边 时 ,为 负 
的 。 这 可 以 通过 C 的 一 个 法 线 矢量 与 方 
向 矢量 Q 的 数量 积 的 符号 来 判断 。 当 曲线 . 
C 是 多 边 形 时 ,只 需 对 C 的 每 一 条 边 做 一 
次 判断 。 对 于 射线 R 来 讲 ,只 要 测试 边 的 
端点 在 射线 RR 的 上 方 还 是 下 方 就 足够 了 。 图 2.15 判断 P 点 是 否 位 于 边 的 左 侧 
如 果 边 从 射线 的 下 方 跨 到 上 方 , 那 么 穿越 是 +1, 从 上 方 跨 到 下 方 ,是 一 1。 然 后 ,只 
要 把 所 有 的 穿越 值 加 起 来 就 得 到 环绕 数 (wn )。 如 图 2.15 所 示 。 

另外 ,我 们 可 以 不 用 计算 实际 的 射线 和 边 的 交点 ,但 需要 判断 点 PP 是 否 在 边 
的 左边 。 但 是 ,对 于 方向 向 上 的 边 和 向 下 的 边 的 判断 与 是 否 在 左边 的 规则 不 同 。 
对 于 方向 向 上 的 边 , 如 果 穿 过 射线 到 达 P 的 右边 ,那么 是 在 边 的 左边 ,因为 三 角 








所 





(a) 上 边缘 (b) 下 边缘 
图 2.16 判断 线段 是 否 在 多 边 形 内 
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形 V;Vi+1P 是 逆 时 针 方 向 的 [图 2.16(a)]。 相 反 , 方 向 向 下 的 边 如 果 穿 越 射线 的 
正方 向 ,那么 在 边 的 右边 ,因为 三 角形 ViV;+1P 是 顺 时 针 方 向 [图 2.16(b)]。 

以 下 转角 算法 是 射线 算法 的 改写 版 ,使 用 了 相同 的 边界 处 理 规则 处 理 特殊 情 
况 。 


typedef struct {int x,y;| Point; 


wn_ PnPoly( Point P,Point V[ ], int n) 
| 
int wn=0; // the winding number counter 
// loop through all edges of the polygon 
for (each edge E[ i]:Vv[i]Vv[i+1] of the polygon) 
if (E[i] crosses upward ala Rule #1) 
| 
if (P is strictly left of E[i]) // Rule #4 
++wn; //avalidup intersect right of P.x 
| 
else if (E[i] crosses downward ala Rule #2) 
| 
if (P ;is strictly right of E[i]) //Rule #4 
—-—wn; //avalid down intersect right of P.x 
| 
returnwn; // =0 <=>Pisoutside Vl] 


| 


很 显然 ,这 个 转角 算法 和 射线 算法 有 相同 的 效率 。 而 且 , 它 还 更 精确 ,因此 ,在 
判断 点 是 否 在 任意 多 边 形 时 ,转角 算法 是 首选 。 


2.11 判断 线段 是 否 在 多 边 形 内 


线段 在 多 边 形 内 的 一 个 必要 条 件 是 线段 的 两 个 端点 都 在 多 边 形 内 ,但 由 于 多 
边 形 可 能 为 止 , 所 以 这 不 能 成 为 判断 的 充分 条 件 。 如 果 线 彼 和 多 边 形 的 某 条 边 内 
交 ( 两 线段 内 交 是 指 两 线段 相交 且 交 点 不 在 两 线段 的 端点 ) ,因为 多 边 形 的 边 的 左 
右 两 侧 分 属 多 边 形 内 外 不 同 部 分 ,所 以 线段 一 定 会 有 一 部 分 在 多 边 形 外 [图 2.17 
(a)]。 于 是 我 们 得 到 线段 在 多 边 形 内 的 第 二 个 必要 条 件 :线段 和 多 边 形 的 所 有 边 
都 不 内 交 。 

线段 和 多 边 形 交 于 线段 的 两 端点 并 不 会 影响 线段 是 否 在 多 边 形 内 ;但 是 如 果 
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多 边 形 的 某 个 顶点 和 线段 相交 ,还 必须 判断 两 相 邻 交点 之 间 的 线段 是 否 包含 于 多 
边 形 内 部 [反例 见 图 2.17(b) ]。 


(a) (b) 


图 2.17 线段 和 和 多边形 关系 举例 


因此 我 们 可 以 先 求 出 所 有 和 线段 相交 的 多 边 形 的 顶点 ,然后 按照 X-Y 坐标 排 
序 (X 坐标 小 的 排 在 前 面 ,对 于 X 坐标 相同 的 点 , Y 坐标 小 的 排 在 前 面 , 这 种 排序 
准则 也 是 为 了 保证 水 平和 垂直 情况 的 判断 正确 ) ,这 样 相 邻 的 两 个 点 就 是 在 线段 上 
相 邻 的 两 交点 ,如 果 任 意 相 邻 两 点 的 中 点 也 在 多 边 形 内 , 则 该 线段 一 定 在 多 边 
形 内 。 

证 明 如 下 : 

命题 1 

如 果 线 段 和 多 边 形 的 两 相 邻 交点 P1、P; 的 中 点 已 也 在 多 边 形 内 , 则 Pi、P> 
之 间 的 所 有 点 都 在 多 边 形 内 。 

证 明 . 

假设 Pi、P; 之 间 含 有 不 在 多 边 形 内 的 点 ,不 妨 设 该 点 为 Q ,在 Pi1、P' 之 间 , 因 
为 多 边 形 是 闭合 曲线 ,所 以 其 内 外 部 之 间 有 界 , 而 Pi 属于 多 边 形 内 部 , Q 属于 多 
边 形 外 部 ,PP 属于 多 边 形 内 部 , P1-Q-P' 完 全 连续 ,所 以 PIQ 和 QP 一定 跨越 多 边 
形 的 边界 ,因此 在 P1、.P' 之 间 至 少 还 有 两 个 该 线段 和 多 边 形 的 交点 ,这 和 Pi1P, 是 
相 邻 两 交点 矛盾 , 故 命题 成 立 。 证 毕 。 

由 命题 1 直接 可 得 出 推论 : 

推论 2 

设 多 边 形 和 线段 PQ 的 交点 依次 为 Pi,P,,… ,了 P, ,其 中 P; 和 P; ;1 是 相 邻 两 交 
点 ,线段 PQ 在 多 边 形 内 的 充 要 条 件 是 :P、Q 在 多 边 形 内 且 对 于 i=1,2,…,n 一 
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1, 了 P;,Pi;+1 的 中 点 也 在 多 边 形 内 。 

在 实际 编程 中 ,没有 必要 计算 所 有 的 交点 ,首先 应 判断 线段 和 多 边 形 的 边 是 否 
内 交 ,倘若 线段 和 多 边 形 的 某 条 边 内 交 则 线段 一 定 在 多 边 形 外 ;如 果 线 段 和 多 边 形 
的 每 一 条 边 都 不 内 交 , 则 线段 和 多 边 形 的 交点 一 定 是 线段 的 端点 或 者 多 边 形 的 顶 
点 ,只 要 判断 点 是 否 在 线段 上 就 可 以 了 。 

至 此 得 出 算法 如 下 : 


证 线段 PQ 的 端点 不 都 在 多 边 形 内 
then return false; 
else 
点 集 pointSet 初始 化 为 空 ; 
for 多 边 形 的 每 条 边 s 
do if 线段 的 某 个 端点 在 s 上 
then 将 该 端点 加 入 pointSet; 
else 证 s 的 某 个 端点 在 线段 PQ 上 
then 将 该 端点 加 入 pointSet; 
else if s 和 线段 PQ 相交 /x 这 时 候 已 经 可 以 肯定 是 内 交 了 */ 
then return false; 
else 
将 pointSet 中 的 点 按照 X-Y 坐标 排序 ; 
for pointSet 中 每 两 个 相 邻 点 pointSet[i] ,pointSet[ i+1] 
do if pointSet[i] ,pointSet[ i+1] 的 中 点 不 在 多 边 形 中 
then return false; 


else return true 


这 个 过 程 中 的 排序 因为 交点 数目 肯定 远 小 于 多 边 形 的 顶点 数目 ,所 以 最 多 
是 常数 级 的 复杂 度 ,几乎 可 以 忽略 不 计 。 因 此 算法 的 时 间 复 杂 度 也 是 O(n )。 


2.12 判断 折线 是 否 在 多 边 形 内 


只 要 判断 折线 的 每 条 线段 是 否 都 在 多 边 形 内 即 可 。 设 折线 有 m 条 线段 ,多边 
形 有 ?个 顶点 , 则 该 算法 的 时 间 复杂 度 为 O(m x n)。 


2.13 判断 多 边 形 是 否 在 多 边 形 内 


只 要 判断 多 边 形 的 每 条 边 是 否 都 在 多 边 形 内 即 可 。 判 断 一 个 有 zm 个 顶点 的 
多 边 形 是 否 在 一 个 有 > 个 顶点 的 多 边 形 内 复 林 度 为 O(m Xn)。 
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2.14 判断 矩形 是 否 在 多 边 形 内 
将 矩形 转化 为 多 边 形 ,然后 再 判断 是 否 在 多 边 形 内 。 
2.15 判断 圆 是 否 在 多 边 形 内 


只 要 计算 圆心 到 多 边 形 的 每 条 边 的 最 短 距 离 , 如 果 该 距离 大 于 或 等 于 圆 半径 
则 该 圆 在 多 边 形 内 。 计 算 圆 心 到 多 边 形 每 条 边 最 短 距离 的 算法 在 后 文 阐述 。 


2.16 判断 点 是 否 在 圆 内 


计算 圆心 到 该 点 的 距离 ,如 果 小 于 或 等 于 半径 则 该 点 在 圆 内 。 


2.17 判断 线段 .折线 矩形 .多边形 是 否 在 圆 内 


因为 圆 是 凸 集 , 所 以 只 要 判断 是 否 每 个 顶点 都 在 圆 内 即 可 。 


2.18 判断 圆 是 否 在 圆 内 


设 两 圆 为 O1、O; ,半径 分 别 为 ri、r2, 要 判断 O> 是 否 在 Oi 内 。 先 比较 71、\72 
的 大 小 ,如 果 ri<r2, 则 O; 不 可 能 在 O1 内 ;如 果 两 圆心 的 距离 大 于  - ~，, 则 
O> 不 在 Oil 内 ;反之 OO; 在 O1 内 。 


2.19 计算 两 条 共 线 的 线段 的 交点 


对 于 两 条 共 线 的 线段 ,它们 之 间 的 位 置 关 系 有 如 图 2.18 所 示 的 几 种 情况 。 
图 2.18(a) 中 两 条 线段 没有 交点 ;图 2.18(b) 和 图 2.18(d) 中 两 条 线段 有 无 穷 交 
点 ; 图 2.18(c) 中 两 条 线段 有 一 个 交点 。 设 L1 是 两 条 线段 中 较 长 的 一 条 , 工 ; 是 较 
短 的 一 条 ,如 果 Li 包含 了 工 ; 的 两 个 端点 , 则 是 图 2.18(d) 的 情况 ,两 线段 有 无 穷 
交点 ;如 果 Li1 只 包含 L; 的 一 个 端点 ,那么 如 果 Li 的 某 个 端点 等 于 被 Li 包含 的 
工 ; 的 那个 端点 , 则 是 图 2.18(c) 的 情况 ,这 时 两 线段 只 有 一 个 交点 ,否则 就 是 图 
2.18(b) 的 情况 ,两 线段 也 是 有 无 穷 的 交点 ;如 果 Li 不 包含 工 ; 的 任何 端点 , 则 是 
图 2.18(a) 的 情况 ,这 时 两 线段 没有 交点 。 
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图 2.18 共 线 线段 的 位 置 关 系 


2.20 计算 线段 或 直线 与 线段 的 交点 


设 一 条 线段 为 Lo = PiP,, 另 一 条 线段 或 直线 为 L1 = Qi1Q,, 要 计算 的 就 是 
Lo 和 工 ; 的 交点 。 

第 一 步 : 首 先 判断 Lo。 和 Li 是 否 相 交 (方法 已 在 前 文 讨 论 过 ) ,如 果 不 相交 则 
没有 交点 ,否则 说 明 Lo 和 工 ; 一 定 有 交点 ,下 面 就 将 Lo 和 工 1 都 看 作 直线 来 考虑 。 

第 二 步 :如 果 Pi 和 P; 横 坐 标 相同 , 即 Lo 平行 于 y 轴 。 

(1) 车 工 ; 也 平行 于 y 轴 , 有 两 种 情况 。 第 一 种 情况 : 若 Pi 的 纵 坐 标 和 Qi 的 
纵 坐 标 相 同 ,说 明 Lo 和 Li 共 线 ,假如 L1 是 直线 , 则 有 无 穷 的 交点 ,假如 Li 是 线 
段 ,可 用 “计算 两 条 共 线 线段 的 交点 ”的 算法 求 交 点 (该 方法 在 前 文 已 讨论 过 )。 第 
二 种 情况 :否则 说 明 Lo 和 Li 平行 , 则 没有 交点 。 

(2) 车工 1 不 平行 于 y 轴 , 则 交点 横 坐 标 为 Pi 的 横 坐 标 ,代入 到 工 ; 的 直线 方 
程 中 可 以 计算 出 交点 纵 坐 标 ; 

第 三 步 : 如 果 Pi 和 P, 横 坐 标 不 同 ,但 是 Q! 和 Q: 横 坐 标 相 同 , 即 Li 平行 于 y 


第 2 章 GIS 算 法 的 计算 几何 基础 35. 


轴 , 则 交点 横 坐 标 为 Qi 的 横 坐 标 ,代入 到 Lo 的 直线 方程 中 可 以 计算 出 交点 纵 坐 标 。 

第 四 步 : 如 果 Pi 和 P; 纵 坐 标 相 同 , 即 Lo 平行 于 xz 轴 。 

(1) 若 工 ! 也 平行 于 二 轴 , 有 两 种 情况 。 第 一 种 情况 : 若 Pi 的 横 坐 标 和 Qi 的 
横 坐 标 相同 ,说 明 Lo 和 工 ; 共 线 ,假如 Li 是 直线 ; 则 有 无 穷 的 交点 ,假如 L1 是 线 
段 ,可 用 “计算 两 条 共 线 线段 的 交点 "的 算法 求 交点 (该 方法 在 前 文 已 讨论 过 ) ;第 二 
种 情况 :否则 说 明 Lo 和 工 i 平行 , 则 没有 交点 。 

(2) 若 志 不 平行 于 工 轴 , 则 交点 纵 坐 标 为 Pi 的 纵 坐 标 ,代入 到 Li 的 直线 方 
程 中 可 以 计算 出 交点 横 坐 标 。 

第 五 步 : 如 果 Pi 和 P; 纵 坐 标 不 同 ,但 是 Qi 和 Q; 纵 坐 标 相 同 , 即 工 ; 平行 于 z 
轴 , 则 交点 纵 坐 标 为 Qi 的 纵 坐 标 , 代 入 到 Lo 的 直线 方程 中 可 以 计算 出 交点 横 坐 标 。 

六 步 : 剩 下 的 情况 就 是 工 ; 和 Lo 的 斜率 均 存 在 且 不 为 零 的 情况 。 

(1) 计算 出 Lo 的 斜率 Ko,Li 的 斜率 Ki1。 

(2) 如 果 K1= K;, 则 有 两 种 情况 。 第 一 种 情况 :如 果 Qi 在 Lo 上 , 则 说 明 Lo 
和 工 ; 共 线 ,假如 Li 是 直线 , 则 有 无 穷 交 点 ,假如 Li 是 线段 ,可 用 “计算 两 条 共 线 
线段 的 交点 ”的 算法 求 交 点 (该 方法 在 前 文 已 讨论 过 ) ;第 二 种 情况 :如 果 Qi 不 在 
Lo 上, 则 说 明 Lo 和 工 ! 平行 , 则 没有 交点 。 

(3) 联 立 两 直线 的 方程 组 可 以 解 出 交点 来 。 

这 个 算法 并 不 复杂 ,但 是 要 分 情况 讨论 清楚 ,尤其 是 当 两 条 线段 共 线 的 情况 需 
要 单独 考虑 ,所 以 在 前 文 将 求 两 条 共 线 线段 的 算法 单独 写 出 来 。 另 外 ,一 开始 就 先 
利用 矢量 又 乘 判断 线段 与 线段 (或 直线 ) 是 否 相 交 , 如果 结果 是 相交 ,那么 在 后 面 就 
可 以 将 线段 全 部 看 作 直线 来 考虑 。 需 要 注意 的 是 ,我 们 可 以 将 直线 或 线段 方程 改 
写 为 ar + by+c=0 的 形式 ,这 样 一 来 上 述 过 程 的 部 分 步骤 可 以 合并 ,缩短 了 代码 
长 度 , 但 是 由 于 先 要 求 出 参数 ,这 种 算法 将 花费 更 多 的 时 间 。 


2.21 求 线段 或 直线 与 圆 的 交点 


设 圆心 为 O, 圆 半径 为 7, 直线 (或 线段 )L 上 的 两 点 为 Pi,P。 

第 一 步 :如果 L 是 线段 量 P,P, 都 包含 在 圆 O 内 , 则 没有 交点 ;否则 进行 下 一 步 。 

第 二 步 :如 果 工 平行 于 y 轴 。 

(1) 计算 圆心 到 工 的 距离 4d; 

(2) 如 果 d >y, 则 工 和 圆 没有 交点 ; 

(3) 利用 勾 股 定理 ,可 以 求 出 两 交点 坐标 ,但 要 注意 考虑 L 和 圆 的 相 切 情况 。 

第 三 步 : 如 果 世 平行 于 z 轴 , 做 法 与 工 平行 于 y 轴 的 情况 类 似 。 

第 四 步 : 如 果 工 既 不 平行 z 轴 也 不 平行 y 轴 , 可 以 求 出 工 的 斜率 K ,然后 列 出 
LL 的 点 斜 式 方程 ,和 圆 方程 联 立即 可 求解 出 L 和 圆 的 两 个 交点 。 
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第 五 步 :如 果 工 是 线段 ,对 于 第 二 至 第 四 步 中 求 出 的 交点 还 要 分 别 判 断 是 否 
属于 该 线段 的 范围 内 。 


2.22 中 心 点 的 计算 


多 边 形 的 中 心 点 (又 叫做 质心 或 重心 ) 可 以 通过 将 多 边 形 分 割 成 为 三 角形 , 求 
取 三 角形 的 中 心 点 ,然后 将 三 角形 的 中 心 点 加 权 求 和 取得 。 三 角形 的 中 心 点 
(cz，,cy) 是 三 角形 三 个 角 点 坐标 的 平均 , 即 
cz = (zx1+ x2 + x3)/3 
cy = (y1+ y2 + y3)/3 
这 里 提出 了 三 角形 中 心 点 的 计算 公式 ,接着 可 以 计算 多 边 形 分 割 后 每 个 三 角 
形 的 中 心 点 ,权重 的 选取 可 以 依据 每 个 三 角形 的 面积 所 占 多 边 形 面 积 的 比例 。 
在 实际 计算 中 计算 方法 可 以 进行 简化 ,不 需要 将 多 边 形 分 割 为 一 组 三 角形 ,但 需 
要 利用 在 计算 多 边 形 面积 时 ,三 角形 面积 的 取 值 为 正 或 负 的 特性 。 具 体 算 法 如 下 : 


int polyCentroid(double x[ ] ,double y[ ] ,int n, 
double * xCentroid,double * yCentroid,double * area) 
| 
int i,j; 
double ai,atmp = 0,xtmp = 0,ytmp=0; 
if (n < 3) return 1; 
for (i=n-1,j=0; j < n; i=j,j++) 
| 
ai=x[i] * y[j] -x[j] * yli]; 
atmp + = ai; 
xtmp + = (x[j]+x[i]) * ai; 
ytmp + = (ylj]+yLi]) * ai; 
| 
x area = atmp / 2; 
if (atmp ! = 0) 
| 
x xCentroid = xtmp / (3 * atmp); 
* yCentroid = ytmp / (3 * atmp); 
return 0; 
} 
return 2; 


| 
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2.23 过 点 作 垂 线 
选取 一 点 C ,选择 一 条 线段 AB , 求 取 过 点 C 垂直 于 AB 的 垂 线段 CP,P 点 位 
于 直线 AB 上 (图 2.19)。 


第 一 步 :依据 2.20 节 所 述 算法 求 取 点 C 到 直线 AB 的 垂 点 P; 
第 二 步 :连接 CP , 则 CP 为 所 求 垂 线 。 


eC 
4 


0 
& 
k 
上 
不 
» 
人 
B 
P 
4 


图 2.19 过 点 做 垂 线 


2.24 作 平 行 线 


选择 一 条 已 有 线段 AB , 选 一 点 C 确定 方向 ,输入 距离 4 ,在 所 选 方向 上 按照 
输入 的 距离 复制 与 所 选 线段 一 样 的 线段 EF( 图 2.20)。 





图 2.20” 作 平行 线 


第 一 步 :依据 2.20 节 所 述 算法 求 取 点 C 到 直线 AB 的 垂 点 已 ; 
第 二 步 :计算 az=Ze 一 pydy 三 光一 yp; 
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第 三 步 :按照 如 下 公式 求 取 瓦 、 下 点 : 
XE = XA+dzr,yr = ya t+ dy 
ZF = XA+dr,yr = yat+dy 


第 四 步 :连接 玉 、 下 点 , 则 线段 EF 为 所 求 平行 线 。 
2.25 过 点 作 平 行 线 


选择 一 条 已 有 线段 AB ,选择 点 位 为 忆 , 选 一 点 C, 以 C 点 为 端点 作 平 行 于 线 
段 AB 的 平行 线 CD ,线段 CD 的 长 度 与 线段 
AB 相等 (图 2.21)。 
第 一 步 :计算 dr = zxp 一 za,dy= vB 一 ya 
第 二 步 : 判 断 点 A 和 点 B 距 PP 点 距离 最 近 
点 。 如 果 距 A 点 最 近 , 则 吃 点 的 位 置 为 
Xp = xXx. t+ dr,yp= y+dy 
如 果 距 B 点 最 近 , 则 DD 点 的 位 置 为 
XD = Xe— dr,yp = yy ~ dy 
第 三 步 :连接 C、D 点 , 则 线段 CD 为 所 求 
平行 线 。 


图 2.21 过 点 作 平 行 线 
2.26 线段 延长 


选择 一 条 已 有 线段 AB ,选择 点 位 为 了 ,输入 延长 线 距 离 4(d >0), 求 取 线段 
的 延长 线 (图 2.22)。 


0D 


图 2.22 线段 延长 


第 一 步 : 求 取 线段 AB 的 长 度 L=V (zp 一 zxA)*+ (yg ya); 
第 二 步 :判断 点 A 和 点 B 距 P 点 距离 最 近 点 。 如 果 距 B 点 最 近 , 则 DD 点 的 位 
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置 为 


ZD =zxpB+(zxp— zaA)' d/L 
yp =ypB + (yB — »4)* d/L 
如 果 距 A 点 最 近 , 则 DD 点 的 位 置 为 


XD 三 XA+ (za 2 ZB) .qd/L 
yp =ya + (ya — y8)* d/L 
第 三 步 :连接 D 点 与 点 A、B 中 距 P 点 的 最 近 点 即 为 所 求 延长 线 。 


2.27 三 点 画 圆 


通过 已 知 三 点 a、b、c 画 圆 (图 2.23)。 算 法 的 关键 是 求 取 圆心 和 圆 半 径 。 

第 一 步 : 求 取 圆 心 P。 

设 三 点 为 a、5、c, 则 令 : a 
人 A=Z 一 To 
B=y,- 
C=zr- zo 
D =y.- 4 
E=A(zxs + zs)+ B(y, + ,) 

F=C(z, + zx) + D(y, + y.) 图 2.23 三 点 画图 
G = 2LA(y. 一 多) -了 (ze 一 25)] 
则 圆心 已 的 坐标 为 
Zp=(DE- BF)/G 
yp =(AF - CE)/G 
第 二 步 : 求 取 圆 半径 R: 


2.28 线段 打 断 


选取 已 有 线段 AB ,根据 输入 距离 在 线段 内 插入 一 个 点 C, 并 将 线段 分 为 两 个 
部 分 (图 2.24)。 算 法 的 关键 是 求 取 内 插 点 的 坐标 。 

第 一 步 :计算 有 向 线段 AB 的 长 度 L =V (zp 一 zxA)? + (2 一 2A) 

第 二 步 :根据 输 入 距离 d 计算 内 插 点 C。 
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Ze =Z4+(zB 一 4)，d[ 人 


yc =ya4+ (ypB— ya): dL 





图 2.24 线段 打 斯 


2.29 前 方 交会 


在 三 角形 ABP 中 (图 2.25), 已 知 点 A.B 的 坐标 为 za 、ya 和 xzp、ypo 在 A 
B 两 点 设 站 , 测 得 人 人 PAB, 人 人 PBA ,通过 解 算出 未 知 点 已 的 坐标 zp yp, 这 是 前 方 
交会 的 基本 概念 。 





B 
(X478) 





图 2.25 前 方 交会 


如 果 图 2.25 中 AP 的 边 长 Sap 和 坐标 方位 角 wap 为 已 知 , 就 可 以 按 坐标 正 算 
公式 求 得 P 点 的 坐标 , 即 
Xp = XA + SApcosaap 
yp = YA + SapsinaAp 
或 
Xp 一 XA 三 94PCOSa4P 
yp — YA = Sapsinaap 


从 图 2.25 可 知 ,aap= oa A, 代入 上 式 则 得 
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Tp — XA = Sapcos(aaB ~ A) = Sap(cosaaBcosA + sinaapsinA ) 


Sapsin(aap — A) = Sap(sinaapcosA + cosaapsinA ) 














yp 4 = 
因为 
XB 一 XA 
cosaAB = 7 
， 8B~4 
sinaAB = 一 
则 
Xp — XA = (ap — za)cotA + (yp — ya)] 
pA = (四 YA)cotA ~ (zB 一 za)] 
根据 正弦 定理 ,得 
Sap sinB sinB 
Sap sinP sin(A + B) 
则 
SapsinA sinAsinB _ 1 
SAB sin(A+B) cotA + cotB 
故 
(zxB — XA)cotA + (yp — ya) 
Wh cotA + cotB 
(yp — ya)cotA ~ (xp — za) 
YT cotA + cotB 
移 项 化 简 即 得 
XACOtB + ZBcotA 一 ya + yp 
2 cotA + cotB 
yacotB+ ypcotA+zxaA— zp 
9 cotA + cotB 
上 式 称 为 余 切 公式 。 
2.30 距离 交会 


设 已 知 点 A、B( 图 2.26) 的 坐标 分 别 为 za、ya 和 xzp\ ye,A 与 B 间 的 已 知 边 
长 为 Sap。 测 量 了 边 长 S,、S,。 在 AABP 中 ,AB 边 的 高 为 h, 而 高 hh 将 AB 边 分 
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成 和 g 两 段 ,显然 1 +g= Sap。 





图 2.26 ”距离 交会 


推导 公式 的 思路 是 这 样 的 :由 已 知 边 Sap 和 观测 边 长 S。、S, 推 出 1、\g、h, 从 
而 算出 人 A 、. 一 B ,并 按 余 切 公式 求 已 点 坐标 。 


由 图 2.26 可 见 
12+12= S$ 
h2*+g?= S2 
li+g= SAaB 


得 :1 = Sap --g, 将 等 式 两 边 取 平方 后 代入 上 式 得 
h*+g*—-2Sapg = St — Sp 





整理 后 得 
Ps S21+ S%p— S$ 
2Sag8 
9 Sz + S2p— S2 
2Sap 
因为 
h=vV St-L =VS:- pg 
L 
cotA = 大 
2 
cotB = 有 
则 
1 1 h 
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以 及 
cotA 1 
cotA + cotB SaB 





cotB _ gg 
cotA +cotB Sap 
将 上 式 代 入 余 切 公 式 ,可 以 求 得 P 点 坐标 : 


Zp =ZA+Lza 一 ZA)+HCye — yA) 
yp =y4+L(ys— ya) + H(zxa — xp) 

















式 中 ， 

a 1 S?+ S2p— S52 

SAB 2S2p 
2 2 
和 = 让 = 这 

SAB S2p S2p 
g S2 + S%p— S$ 

C = - 2 


2.31 极 坐 标 作 点 


选择 已 有 线段 AB( 图 2.27), 以 已 有 线段 为 极 轴 ,输入 角度 a 和 长 度 4, 求 点 
P 坐标 。 

第 一 步 : 计算 有 向 线段 AB 的 长 度 L = 
V (zB— xa) + (yp— yA) 

第 二 步 : 根 据 有 向 线段 AB 坐标 计算 


az = XB— XA 


Pp 
» 
到 





dy = yp — YA 
第 三 步 :以 点 A 为 基点 旋转 有 向 线段 AB， : 
则 a 


dz = dzcosa — dysina 图 2.27 极 坐 标 做 点 
dy = dzsina + ycosa 


第 四 步 : 求 取 已 点 坐标 
TP 二 Z4 二 dr .dz 
yp= y+dy*d/L 
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思 考题 


. 简 述 维 数 扩展 的 9 交 数 据 模型 。 

. 编写 判断 点 是 否 在 线段 上 的 程序 。 
. 编写 判断 两 线段 是 否 相 交 的 程序 。 
. 编写 判断 点 是 否 在 多 边 形 内 的 程序 。 


编写 多 边 形 中 心 点 求 取 的 计算 程序 。 


第 3 音 空间 数据 的 变换 算法 
3.1 平面 坐标 变换 
3.1.1 平面 直角 坐标 系 的 建立 


在 平面 上 选 一 点 O 为 直角 坐标 原点 ， 
过 O 点 作 相互 垂 直 的 两 轴 z'Oz 和 Oy 而 
建立 平面 直角 坐标 系 , 如 图 3.1 所 示 。 

在 直角 坐标 系 中 ,规定 Or 、Oy 方向 为 
正 值 , Ox’、Oy 方向 为 负 值 ,因此 在 坐标 系 
中 的 一 个 已 知 点 卫 , 它 的 位 置 便 可 由 该 点 对 
Oz 与 Oy 轴 的 垂 线 长 度 唯一 地 确定 , 即 x = 
AP,y= BP 通常 记 为 P(z,y)。 


3.1.2 平面 坐标 变换 矩阵 





平面 坐标 变换 抢 阵 可 用 下 式 表示 : 


ad g 
-| e 1 
£3 


从 变换 功能 上 可 把 了 分 为 4 个 子 矩阵 ,其 中 | 。 “| 是 对 图 形 进 行 缩放 . 放 


图 3.1 平面 直角 坐标 系 


转 对 称 , 错 切 等 变换 ;[。 门 是 对 图 形 进行 平移 变换 ; | | 对 图 形 做 投影 变换 , 
的 作用 是 在 zx 轴 的 1/g 处 产生 一 个 灭 点 ,有 的 作用 是 在 y 轴 的 17h 处 产生 一 个 灭 
点 ;[ 引 是 对 整体 图 形 做 伸缩 变换 。T 为 单位 矩阵 即 定义 二 维 空间 中 的 直角 坐标 
系 ,此 时 了 可 看 作 是 3 个 行 矢量 ,其 中 [1 0 0] 表 示 z 轴 上 的 无 穷 远 点 ， 
[0 1 0] 表 示 y 轴 上 的 无 穷 远 点 ,[0 0 1] 表 示 坐标 原点 。 
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3:153: 冬季; 这 搓 
1 0 0 

[zx*” y*” 1]=[x y 1xl0 1 0|=[z+T, y+T, 1] 
T. T, 1 


< 


平移 变换 如 图 3.2(a) 所 示 。 





Wa B* E eal 
C* 
* 


(g) x 轴 对 称 (b 中 心 对 称 0 y=x 对 称 





(四 二 -x 对 称 (k) 相对 原点 旋转 6 角 
图 3.2 平面 直角 坐标 变换 
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3.1.4 比例 变换 


ste 0 0 
0 yy 
0 0 1 
(1) 当 s, = sy,=1 时 ,为 恒 等 比 例 变换 , 即 图 形 不 变 ,如 图 3.2(b) 所 示 ; 
(2) 当 s. = s,>1 时 ,图 形 沿 两 个 坐标 轴 方 向 等 比例 放大 ,如 图 3.2(c) 所 示 ; 
(3) 当 5s, = s,<1 时 ,图 形 沿 两 个 坐标 轴 方 向 等 比例 缩小 ,如 图 3.2(d) 所 示 ; 
(4) 当 s. 关 sy 时 ,图 形 沿 两 个 坐标 轴 方 向 做 非 均 名 的 比例 变换 ,如 图 3.2(e) 
所 示 。 


[z” y* 1]=[x yy 1jx = [sex sy 1] 








3.1.5 对 称 变换 


ad 0 
[z” y* 1=[z y ob e 9 -teeth drtey 1] 
0 0 1 
(1) 当 5=d=0,a= -1,e=1 时 ,有 x*= 一 x,y* =y, 产 生 与 y 轴 对 称 的 
反射 图 形 ,如 图 3.2({) 所 示 ，; 
(2) 当 5=d=0,a=l,e= -1 时 ,有 z =z,y = 一 y, 产 生 与 x 轴 对 称 的 
反射 图 形 ,如 图 3.2(g) 所 示 ; 
(3) 当 5=4d=0,a=e= 一 1 时 ,有 zx*= 一 x,y"* = 一 y, 产 生 与 原点 对 称 的 
反射 图 形 ,如 图 3.2(h) 所 示 ; 
(4) 当 5=d=1,a=e=0 时 ,有 x*=y,y"=xz, 产 生 与 直线 y= x 对 称 的 反 
射 图 形 ,如 图 3.2(i) 所 示 ，; 
(5) 当 65=4d= 一 1,a=e=0 时 ,有 zx*= 一 y,y* = 一 zx, 产生 与 直线 y= 一 z 
对 称 的 反射 图 形 ,如 图 3.2(j) 所 示 。 


3.1.6 旋转 变换 
cosg sin0 0 
[zx” vy* 1]j=[x y | cosO | 
0 0 1 


= [zcos0— ysing zsing+ycosO 1] 


如 图 3.2(k) 所 示 , 在 zOy 平面 上 的 二 维 图 形 绕 原点 顺 时 针 旋 转 0 角 , 则 变换 
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矩阵 为 
cosg sin0 0 
一 sin0 cos@ 0 


0 0 1 





3.1.7 错 切 变换 


1 d 0 

[Lz” y” 1]=[x y ob 1 0 

0 0 1 

(1) 当 d=0 时 ,zx' =x+by,y” =y, 此 时 图 形 的 y 坐标 不 变 ,z 坐标 随 初 什 

(z,y) 及 变换 系数 5 而 做 线性 变化 ;如 5 >0, 图 形 沿 + z 方向 做 错 切 位 移 ;5 <0， 
图 形 沿 - 工 方 向 做 错 切 位 移 , 如 图 3.3(a) 所 示 。 

(2) 当 5=0 时 ,zx* =zy =az+y, 此 时 图 形 的 z 坐标 不 变 , y 坐标 随 初 值 

(z,y) 及 变换 系数 4 做 线性 变化 ;如 &>0, 图 形 沿 + y 方向 做 错 切 位 移 ;d <0 时 ， 
图 形 沿 一 y 方 向 做 错 切 位 移 , 如 图 3.3(b) 所 示 。 


(3) 当 5 关 0, 且 d 关 0 时 ,x*=x+by,y* = dxr+y, 图 形 沿 x 、y 两 个 方向 做 
错 切 位 移 。 


=[z+pby cr+y 1] 








(a) x 方向 (b)y 方 向 


图 3.3 xz、y 方 向 的 错 切 变换 


3.1.8 复合 变换 


复合 变换 是 指 图 形 做 一 次 以 上 的 几何 变换 ,变换 结果 是 每 次 变换 矩阵 相 乘 。 
(1) 复合 平移 
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1 0 0 1 0 0 1 0 0 
T=10 1 0 | 0 1 | 将 0 1 | 
Tl Ty 1 T,2 Tp 1 Ti + 了 22 T. 1 十 了 2 1 


(2) 复合 比例 - 


Szl 0 0 Sr2 0 0 Szl1Sz2 0 0 
T=|0 sy 0110 sy 0I= 0 sylsy2 0 
0 0 UL0 0 1 0 0 1 





(3) 复合 旋转 
ee 6 
T= |- sin0 0 一 ee = |— sin(0 + 0,)cos(O1 十 加 
0 0 0 0 0 0 











比例 、 旋 转变 换 是 与 参考 点 有 关 的 ,上 面 介绍 的 均 是 相对 原点 所 做 比例 、 旋 转 
变换 。 如 要 相对 某 一 个 参考 点 (zy, yy) 做 比例 、 旋 转变 换 , 其 变换 的 过 程 是 先 把 坐 
标 系 原点 平移 至 (xy, yy) ,在 新 的 坐标 系 下 做 比例 或 旋转 变换 后 ,再 将 坐标 原点 平 
移 回去 ,其 变换 公式 如 下 。 

3.1.9 相对 (zr,yr) 点 的 比例 变换 
rd 0 O01ls. 0 0IT1 0 0 
T=| 0 1 | 。 Sy ， [ 1 | 
L-zr -yy HDL0 0 :yl 
[ 8 0 0 
0 5 ， 
LE-s)zr (1-s)yr 1 


3.1.10 相对 (zj,yy) 点 的 旋转 变换 


fF 1 0 0]F cosb sin0 OFfl 0 0 
T=| 0 1 0ll-sin -cosg 0||0 1 0 
Ll-r -yy 1 0 0 tr y 1 


E cosO Sing | 





= 一 Sinb 一 cosO 0 





LT 一 cosg)zr+yrsing (1+cosg)yr 一 Zrsing 1 
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3.1.11 几 点 说 明 


说 明 如 下 : 

(1) 平移 变换 只 改变 图 形 的 位 置 ,不 改变 图 形 的 大 小 和 形状 ; 

《2) 旋转 变换 仍 保持 图 形 各 部 分 间 的 线性 关系 和 角度 关系 ,变换 后 直线 的 长 
度 不 变 ; 

(3) 比例 变换 可 改变 图 形 的 大 小 和 形状 ; 

(4) 鲁 切 变换 引起 图 形 角度 关系 的 改变 ,甚至 导致 图 形 发 生 畸 变 ; 

(5) 拓扑 不 变 的 几何 变换 不 改变 图 形 的 连接 关系 和 平行 关系 。 


3.2 球面 坐标 变换 
3.2.1 球面 坐标 系 的 建立 


为 在 球面 上 确定 点 位 可 视 需 要 而 采用 不 同 的 坐标 系 。 实 践 中 常 使 用 的 有 地 理 
坐标 系 (P,A) ,球面 极 坐 标 系 (a ,=) 和 球面 直角 坐标 系 (z,y)。 如 图 3.4 所 示 , 其 
中 为 球面 上 某 一 点 ,P 为 地 理 坐 标 系 极点 , Q 为 球面 极 坐标 系 极点 。 各 坐标 系 
之 间 可 以 进行 简单 的 相互 换算 。 

地 理 坐标 与 球面 极 坐 标 之 间 的 关系 :利用 球面 三 角 公 式 , 在 球面 三 角形 PKQ 
中 有 

cosz = singsingo + cospcosgpocos(A 一 40) 
| = singcosgpo — cospsinpocos(A — A0) (3.1) 
sinzsina = cosgsin(A — A0) 
式 中 , po、X0, 为 球面 极 坐 标 系 坐标 原点 Q 的 地 理 坐 标 。 
球面 直角 坐标 与 球面 极 坐标 之 间 的 关系 :在 球面 三 角形 QKK, 中 有 


Jeota = sinAzcoty (3.2) 





cosz = cosAxcoty 
式 中 ,Az= 工 - poo 

目前 ,以 上 三 种 坐标 系 中 以 地 理 坐标 系 在 GIS 应 用 最 为 广泛 。 一 般 情 况 下 ， 
大 多 数 地 图 投影 都 采用 地 理 坐 标 作为 球面 上 点 位 的 参数 来 建立 与 平面 直角 坐标 系 
相对 应 的 投影 方程 式 ,从 而 获得 地 图 的 数学 基础 。 

在 实用 上 ,有 时 为 使 变形 情况 最 为 良好 ， 或 者 使 投影 符合 菜 一 指定 的 条 件 而 采 
用 横 轴 或 斜 轴 投 影 。 此 时 坐标 系 中 的 经 纬 线 投影 后 将 会 成 为 较 复杂 的 曲线 ,用 地 
理 坐 标 表示 点 位 时 则 对 投影 公式 的 推导 与 计算 都 比较 麻烦 , 若 选用 适当 的 球面 上 
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的 其 他 坐标 系 却 有 可 能 沿用 正 轴 投影 的 公 p 
式 , 从 而 改善 了 计算 的 方法 ,于 是 便 需要 应 » 
用 球面 极 坐 标 系 以 及 进行 由 地 理 坐 标 系 到 
球面 极 坐 标 系 的 变换 。 

”在 采用 球面 极 坐 标 系 时 ,首先 要 确定 一 
个 极 坐标 的 “极点 "Q ,球面 上 的 各 点 便 可 以 
以 新 极 Q 为 原点 ,以 方位 角 a 和 天 顶 距 xz 
表示 其 位 置 。 从 形式 上 不 难看 出 ,新 极点 相 
当 于 地 理 坐 标 系 中 的 北 ( 南 ) 极 P(P1), 方 位 
角 a 相当 于 4 ,天 顶 距 z 相当 于 90" - pw。 可 
见 ,球面 极 坐标 系 与 地 理 坐 标 系 形式 上 基本 
一 致 ,地 理 坐 标 系 的 极点 P(g = 土 90") 仅 是 
地 球 表 面 上 的 一 个 特殊 点 ,地 理 坐 标 系 也 仅 图 3.4 球面 上 的 坐标 系 
是 球面 极 坐标 系 的 一 种 特殊 情况 。 

这 样 ,要 用 球面 极 坐标 计算 地 图 投影 , 仅 需 将 GIS 数据 区 域内 各 经 纬 线 交点 的 
坐标 p、 用 式 (3.1) 换 算 成 新 坐标 系 中 的 极 坐标 a 、z, 然 后 把 a 视 为 *, 把 90" 一 z 视 
为 p 应 用 现成 的 正 轴 投 影 公式 进行 计算 而 无 须 另 行 推导 横 轴 与 斜 轴 的 投影 公式 。 

下 面 需 要 解决 的 是 如 何 确定 一 个 GIS 数据 区 域 中 的 新 极 Q 以 及 如 何 把 GIS 
数据 区 域内 各 点 的 gp .4 换算 为 a、z 的 问题 。 





3.2.2 确定 新 极 Q 地 理 坐 标 中 po、Ao 


在 实践 中 ,通常 有 下 列 三 种 情况 : 
1. 新 极 在 投影 区 域 的 中 心 点 上 


通常 可 按 已 有 的 数据 确定 Q 点 及 其 go、40, 或 者 取 GIS 数据 区 域 边界 上 一 定 
数量 点 的 经 纬度 求 其 算术 平均 值 , 即 


(3.3) 


式 中 ,9;、4; 分 别 为 边界 上 相应 点 的 经 纬度 ;n 为 所 取 点 数 。 
除 特定 的 制图 任务 外 , go 与 1o 一 般 取 至 整 度 或 半 度 即 可 。 
对 于 某 些 特定 的 用 途 , 常 是 指定 一 点 作为 Q 点 ,例如 , 某 一 居民 点 或 整 度 (或 
半 度 ) 的 经 纬 线 交 点 。 
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2. 新 极 通过 投影 区 域 中 部 大 圆 的 天 项 


已 知 大 圆 的 位 置 , 可 借助 地 球 仪 近似 地 来 求 定 新 极 Q 的 地 理 坐 标 wo 与 40; 或 
者 利用 某 些 特制 的 投影 网 格 ,以 图 解 方法 求 定 Q 点 的 go 与 h0。 

欲 较 精确 地 求 定 Q 点 的 坐标 ,可 以 利用 解析 法 。 此 法 应 知道 大 圆 上 的 两 个 已 
知 点 (图 3.5 中 的 1.2 两 点 ) 的 地 理 坐标 ,并 且 这 两 点 不 在 球体 直径 的 两 端点 上 , 即 
可 利用 式 (3.1) 获 得 Q 点 坐标 po 与 Mo 的 表达 式 。 


由 于 Q 点 到 过 1.2 点 的 大 圆 的 天 项 距 z=90°, 故 式 (3.1) 中 的 第 1 式 成 为 
i =— cos(A41 — Ao) EE 
tang2tango = — cos(A2 — A0) 
两 式 相 除 ,有 


tanp2 cos(X2 — 40) 


tanpl cos(A1 — Ao) 


Pp Ho 





图 3.5 求 定 已 知 大 圆 的 极点 


由 上 式 可 解 出 
ee 2 A (3.5) 
tang2sinA1 一 tanplsinA2 
利用 式 (3.4) 求 得 wo 的 表达 式 为 
于 cos(A1 — Ao) cos(A> — Ao) (3.6) 








tan1 tang2 
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由 于 正切 函数 的 周期 为 r, 故 由 式 (3.5) 及 式 (3.6) 求 得 的 wo 与 1o 均 有 不 同 
符号 的 两 值 , 即 此 两 值 是 同一 直径 的 两 端点 ,如 图 3.6 中 的 Q 与 Qi ,在 应 用 时 视 
制图 区 域 的 位 置 择 其 恰当 的 一 点 即 可 。 

下 面 为 求 定 过 北京 .巴黎 两 点 的 大 圆 的 天 顶 Q (Qi) 坐标 go 与 1o 的 算 例 
( 表 3.1)。 





巴黎 A1=2°20° 北京 A2=116°30" 
ol=48"50- 9 三 40"00- 
图 3.6 求解 过 北京 .巴黎 两 点 的 大 圆 的 天 项 坐标 


表 3.1 求 天 项 8(Q1) 坐 标 po 与 46 的 解 算 过 程 








































tangl 1.143 632 6 tang2sinA1 = @ 0.034 162 2 
tang2 0.839 099 6 tangisinA2= @ 1.023 476 0 
sinA1 0.040 713 0 @-@ —0.989 313 8 
sinA2 0.894 934 3 tanAo = 多 二 -1363 2581 
cos)l 0.999 170 8 Xo 53°44” 
cosA2 | -0.4461978 | A1~Ao 51°24 
tang2cosA1= © 0.838 403 8 X2~ A0 国 | 62°46” 
tangicosi2= @) | 一 0.5102863 cos(A1 一 A0) 0.623 879 6 
中 -@ 1.348 690 1 cos(A2 一 40) 时 0.457 6152 
tango 0.545 524 4 
tango -0.5453645 











一 28 37- 
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故 Q 点 坐标 po = -2837 ,10= 53"44- 
Qi 点 坐标 po=28"37 ,40= 一 126*16( 对 踊 点 ) 
特例 , 当 大 圆 与 赤道 垂直 ,大 圆 亦 即 经 线 图 ,如 其 经 度 为 4., 则 go 与 1o 可 简 
单 地 获得 
AM0 = A + 90° 
| i 


po=0 
3. 新 极 通过 投影 区 域 中 部 小 圆 的 天 顶 


小 圆 天 顶 的 地 理 坐 标 po 与 ho 同样 可 以 利用 地 球 仪 近似 地 求 出 。 如 需要 较 精 
确 地 确定 po 与 Mo 值 , 也 可 用 图 解法 或 解析 法 。 在 利用 图 解法 和 解析 法 时 , 则 需 知 
道 小 圆 上 3 个 点 的 地 理 坐 标 来 作为 起 算数 据 。 


3.3 仿 射 变换 


仿 射 变换 是 使 用 最 多 的 一 种 几何 纠正 方式 。 在 保留 线条 平行 条 件 下 , 仿 射 转 
换 人 允许 对 长 方形 目标 做 旋转 .平移 .倾斜 和 不 均匀 缩放 。 旋 转 指 在 原点 旋转 zx 和 y 
轴 ; 平 移 指 把 原点 移 到 新 的 位 置 ;倾斜 指 以 一 个 倾向 将 形状 改变 为 平行 四 边 形 ;不 
均匀 缩放 指 在 x 或 y 方向 同时 或 单独 增 大 和 缩小 比例 尺 。 

因为 地 图 的 几何 变换 是 以 控制 点 为 基础 的 ， 所 以 仿 射 变换 及 其 操作 首先 作用 
于 控制 点 。 换 言 之 , 即 把 控制 点 由 在 数字 化 地 图 的 位 置 (又 称 输入 或 估计 控制 点 ) 
变 成 它 的 现实 世界 坐标 (又 称 输出 或 实际 控制 点 )。 在 数学 上 , 仿 射 变换 表达 为 一 
组 线性 方程 

六 =A4r+By+C 
y= Drt+t+Ey+F 

式 中 ,x 和 y 为 图 面 坐标 ;zx 和 为 现实 世界 坐标 ; A、B、C、D、E 和 下 为 转换 系 
数 。 这 6 个 系数 可 以 由 控制 点 的 数字 化 位 置 和 它 的 现实 世界 坐标 进行 估算 。 至 少 
3 个 控制 点 用 于 估算 方 能 有 效 , 但 通常 用 4 个 或 更 多 控制 点 来 减少 测量 误差 。 类 
似 于 回归 分 析 , 在 采用 4 个 或 更 多 的 控制 点 时 ,最 小 二 乘法 用 来 估算 变换 系数 。 

导出 变换 系数 的 一 种 方法 是 运行 两 个 多 元 回归 分 析 : 第 一 是 对 = 和 y 回归 X， 
第 二 是 对 z 和 y 回归 YY。 

令 误差 方程 为 

Qi = X-(Art+By+C) 
= Y-(Dr+Ey+F) 

式 中 ,X、Y 为 已 知 的 理论 坐标 。 
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由 Q2 最 小 和 Qs 最 小 的 条 件 可 得 到 两 组 法 方程 : 
AD r+Boy+ Cn = SD 
A By Za 
A te 
DO r+t+EDy+t+Fn = DX 
DD r+ED) ry+F r= > xzX 
DO zy+E2 只 + 下 2 = 2 
式 中 ,n 为 控制 点 个 数 ;z、y 为 控制 点 坐标 ;XX、Y 为 控制 点 的 理论 值 ;A、B、C、D、 
EE 和 下 为 待定 系数 。 通 过 上 述 方 程 就 可 求 得 仿 射 变换 的 待定 系数 。 
另 一 种 估算 变换 系数 的 方法 是 用 以 下 矩阵 方程 ; 
让 下。 | | DY 
4 ol- Ds Ee Es S| FY 
和 2 2 2 


式 中 ,x 为 控制 点 数目 ;所 有 其 他 符号 的 含义 与 前 面相 同 。 由 该 矩阵 方程 导出 的 变 
换 系 数 与 回归 分 析 结果 相同 。 


3.4 地 图 投影 变换 
3.4.1 概 述 


当 系 统 所 使 用 的 数据 是 来 自 不 同 地 图 投影 的 图 幅 时 ,需要 将 一 种 投影 的 几何 
数据 转换 成 所 需 投影 的 几何 数据 ,这 就 需要 进行 地 图 投影 变换 。 

地 图 投影 变换 的 实质 是 建立 两 平面 场 之 间 点 的 一 一 对 应 关系 。 假 定 原 图 点 的 
坐标 为 =,y( 称 为 旧 坐标 ) ,新 图 点 的 坐标 为 X, Y( 称 为 新 坐标 ) , 则 由 旧 坐 标 变换 
为 新 坐标 的 基本 方程 式 为 

到 fi(zx,y) 
; Y = fo(zx,y) 

实现 由 一 种 地 图 投影 点 的 坐标 变换 为 男 一 种 地 图 投影 点 的 坐标 就 是 要 找 出 上 

述 关 系 式 ,其 方法 通常 分 为 解析 变换 法 .数值 变换 法 和 数值 解析 变换 法 三 类 。 


1. 解析 变换 法 
这 类 方法 是 找 出 两 投影 间 坐 标 变换 的 解析 计算 公式 。 由 于 所 采用 的 计算 方法 
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不 同 ,又 可 分 为 反 解 变 换 法 和 正解 变换 法 。 
反 解 变换 法 (又 称 间 接 变 换 法 ) 是 一 种 中 间 过 渡 的 方法 , 即 先 解 出 原 地 图 投影 
点 的 地 理 坐 标 p、4 ,对 于 x 、y 的 解析 关系 式 , 将 其 代入 新 图 的 投影 公式 中 求 得 其 


坐标 。 即 
正解 变换 法 (又 称 直接 变换 法 ) 是 不 需要 反 解 出 原 地 图 投影 点 的 地 理 坐 标的 解 
析 公式 ,而 是 直接 求 出 两 种 投影 点 的 直角 坐标 关系 式 。 即 











之 ， 





2. 数值 变换 法 


如 果 原 投影 点 的 坐标 解析 式 不 知道 ,或 不 易 求 出 两 投影 之 间 坐 标的 直接 关系 ， 
可 以 采用 多 项 式 逼 近 的 方法 , 即 用 数值 变换 法 来 建立 两 投影 间 的 变换 关系 式 。 例 
如 ,可 采用 二 元 三 次 多 项 式 进行 变换 。 二 元 三 次 多 项 式 为 
X =ao0+aioz 二 aoy + a20z2 + anzy + awy 十 03072 十 Ga2172y 
+ ay + ao333 
Y =bo0 + bioxz + bory + Bax? + bry + by + box + Bary 
+ DZ + bo3y 
通过 选择 10 个 以 上 的 两 种 投影 之 间 的 共同 点 ,并 组 成 最 小 二 乘法 的 条 件 式 ， 
即 


J — Xi)? = min 


2 (Y; Y;)?* = min 


式 中 ,n 为 点 数 ; XX; 、Y; 为 新 投影 的 实际 变换 值 ; Xi Yi; 为 新 投影 的 理论 值 。 根 据 
求 极 值 原理 ,可 得 到 两 组 线性 方程 , 即 可 求 得 各 系数 的 值 。 

必须 明确 ,实际 中 所 磁 到 的 变换 ,决定 于 区 域 大 小 \ 已 知 点 密度 、 数 据 精 度 、 所 
需 变换 精度 及 投影 间 的 差异 大 小 ,理论 和 时 间 上 绝 不 是 二 元 三 次 多 项 式 所 能 概 
括 的 。 


3. 数值 解析 变换 法 


当 已 知 新 投影 的 公式 ,但 不 知 原 投影 的 公式 时 ,可 先 通过 数值 变换 求 出 原 投影 
点 的 地 理 坐标 p,) ,然后 代 人 新 投影 公式 中 , 求 出 新 投影 点 的 坐标 。 即 
| 
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3.4.2 ”地球 椭 球体 的 相关 公式 
1. 子午 圈 曲 率 半径 、 卯 西 图 曲率 半径 ,平均 曲率 半径 和 纬 圈 半 径 
图 3.7 中 , 设 过 椭 球 表面 上 任 一 点 作 A 法 线 AL ,通过 法 线 的 平面 所 截 成 的 截 
夯 凡 硕 洋 吉 贾 让 芝 了 成 光 区 了 了 Nf 克基 入 个 洋 酸 面 , 诱 综 嘻 和 于 休 
在 某 点 上 的 曲率 起 见 ,通常 研究 两 个 相互 垂直 的 法 截面 的 曲率 ,这 种 相互 垂直 的 法 


截面 称 为 主 法 截面 。 

对 椭 球 体 来 说 ,要 研究 下 列 的 两 个 主 法 截面 ,一 个 曲率 半径 具有 最 大 值 ,而 另 
一 个 曲率 半径 具有 最 小 值 。 

第 一 个 是 包含 子午 圈 的 截面 , 称 为 子午 圈 截 面 ,从 图 3.7 中 看 出 ,就 是 过 A 点 
的 法 线 AL 同时 又 通过 椭 球 体 旋转 轴 PP; 的 法 截面 ( 即 AE1P1EP)。 子 午 圈 曲 率 
半径 通常 用 字母 M 表示 , 它 是 A 点 上 所 有 截面 的 曲率 半径 中 的 最 小 值 : 

2 
(3.8) 
式 中 ,a 为 椭 球 体 的 长 半径 ;e 为 第 一 偏心 率 , 当 椭 球体 选 定 后 ,a 、e 均 为 常数 ; p 
为 纬度 。 可 见 M 随 纬度 而 变化 。 


M= 













Ei 


A 
cSN NN 








Pi 


图 3.7 子午 圈 、 卯 西 圈 、 纬 圈 


第 二 个 是 垂直 于 子午 圈 的 截面 称 为 卯 西 圈 截 面 , 从 图 3.7 中 看 出 , 即 通过 A 
点 的 法 线 AL 并 垂直 于 子午 圈 截 面 的 法 截面 QAW。 它 具有 A 点 上 所 有 截面 的 曲 
率 半径 中 的 最 大 值 。 卯 西 图 曲率 半径 以 字母 N 表示 : 
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a 











Ss {1— e2sin2p)1X2 (3.9) 
式 中 符号 与 式 (3.8) 相 同 ,可 见 N 也 随 纬度 而 变化 。 
平均 曲率 半径 R 等 于 主 法 截面 曲率 半径 的 几何 中 数 : 
人 a(l- e2)1 ?2 
R=vMN = 了 (3.10) 
当 p=0" 时 , 代 人 式 (3.8) . 式 (3.9) 
Mo: = a(1 -~ e?) (3.11) 
No =a (3.12) 
当 9p=90" 时 , 代 人 式 (3.8) ` 式 (3.9) 
Mo = = (3.13) 
Neo = 5 (3.14) 


比较 式 (3.11)、 式 (3.12)、 式 (3.13) 和 式 (3.14), 可 见 子午 圈 曲 率 半 径 与 卯 本 
圈 曲 率 半 径 除 在 两 极 处 相等 外 ,在 其 他 纬度 相同 情况 下 ,同一 点 上 卯 酉 图 曲 率 半 径 
均 大 于 子午 轿 曲 率 半径 。 

纬 圈 的 半径 ,一 般 用 > 表示 , 即 

QCoSO 
(1 一 e2sin2p)L2 





(3.15) 


2. 子午 线 弧 长 


子午 线 弧 长 就 是 椭圆 的 弧 长 ,由 图 3.8 可 知 ,椭圆 上 不 同 纬度 的 点 , 它 的 曲率 
半径 也 是 不 相同 的 。 

图 3.8 中 ,在 子午 线 上 任 取 一 点 A ,其 纬度 为 wa , 取 与 A 点 无 限 接近 的 一 点 
A“, 其 纬度 为 pa+dp, 设 C 为 AA =ds 的 曲率 中 心 , M 为 该 弧 的 曲率 半径 ( 即 子 
午 线 A 点 上 的 曲率 半径 ) ,因为 AA “其 小 ,可 以 把 它 看 作 以 M 为 半径 的 圆周 ,应 用 
弧 长 等 于 半径 乘 圆心 角 的 公式 : 

AA’ = ds = Mdg (3.16) 

将 式 (3.8) 代 入 

(1 — e”) 

ke ” 11 id 

欲求 A、B 两 点 之 间 子 午 线 弧 长 * 时 ,需求 以 pa 和 gs 为 区 间 的 积分 ,得 


(3.17) 
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图 3.8 子午 线 弧 长 
9 Pp a(1 FE e2) 
Se Mdo = | 
上 人 | (1 一 ezsin 9)3 2 


令 oa=0、op= 工 则 

下 a(1-e2) 
0 (1 ~ e2sin2p)27/2 9 

积分 后 经 整理 得 从 赤道 到 任意 纬度 z 子午 线 弧 长 的 一 般 公式 为 
s =a(l ~ es)[Aizx ~ cos(x)(Bisin(x) + Cisim (zx) 


em 


+ Disin5(z) + Eisin (xz) + Fisin (xz) + Gisinl (zx) +:…)] (3.18) 


s =a(l ~ e2)(A»zx — Bsin(2z) + Cosin(4x) 


— Dssin(67x) + Eosin(8z) — Fosin(10z) + Gzsin(12x) 一 …)(3.19) 
式 (3.18) 和 式 (3.19) 等 价 , 式 (3.18) 用 三 角 函 数 级 数 表达 从 赤道 到 任意 纬度 
子午 线 弧 长 公式 , 式 (3.19) 用 售 和 角 函 数 表达 从 赤道 到 任意 纬度 x 子午 线 弧 长 


公 邢 o 
式 中 ,xz 为 弧度 ,其 他 相关 参数 值 如 下 
3 ， 4 ,175 。, 11025 。 43 659 1o ，693 693 1 
二 1 十 一 一 6 十 一 一 一 一 一 
A -1+4° + +256° +16384° + 65536° 十 1048 576° 
3 3, 45.4, 175,6 ,11025 8 , 43 659 1o ，693 693 1 




















= 一 e2 + 一 
3 
C 15 L7566 3675。， 14 553,10 ， 231 231。 

32° 1 384° 1 8192° “327684 524288? 


六 -35 6 + 735 8 , 14 553 10 , 231 231 1 
1. 96° 2048° ”40 960″ ”655 360° 
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315 。，46237 io ，99 099 1 














E1 =1024° 1 20480° * 327 680° 

ee 

G1 = 
ee 


3 2 1 15,4, 525 6 , 2205 。 72765 io , 297 297 1 

8° “324 1 1024° | 4096° * 131072° ”524 288? 

C, = 15 04 4 105 ,6 , 2205 8 , 10 395 10 , 1 486 4851» 
256° 1024″ 16384° 65536° 8388 608° 


35 6 ，105 s, 10395 io _55055 1 


























D2 “3072° + 4096° * 262 144° * 1048 576° 
0 < “ 二 和 


以 北京 54 坐标 系 为 例 , 第 一 偏心 率 的 平方 为 :0.006 693 421 622 966 

A1 =1.005 051 773 902 64 

Bi =0.005 051 773 902 641 
C1 =0.000 021 138 456 945 
Di1 =0.000 000 110 055 672 
E =0.000 000 000 621 571 
Fi =0.000 000 000 003 661 
G1 =0.000 000 000 000 022 


3. 纬 线 弧 长 


因为 纬 线 (平行 圈 ) 为 圆 弧 , 故 可 应 用 求 圆周 弧 长 的 公式 : 
设 A、B 两 点 的 经 差 为 1,D 为 纬 线圈 圆心 , 则 由 图 3.9 可 得 
5s=r'A= Neosp :1 (3.20) 
式 中 ,A 和 og 为 弧度 。 
以 北京 54 坐标 系 为 例 ,分 析 子 午 线 弧 长 公式 可 知 同 纬 差 的 子午 线 弧 长 由 赤 
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> 


图 3.9 纬 线 弧 长 


道 向 两 极 逐 渐 增 长 。 例 如 , 纬 差 1 的 子午 线 弧 长 在 赤道 为 110 576m, 在 两 极为 
111 69S$m。 
分 析 纬 线 弧 长 公式 可 知 同 经 差 的 纬 线 弧 长 由 赤道 向 两 极 缩短 ,例如 ,在 赤道 上 
经 差 1 的 弧 长 为 111 321m ,在 纬度 45" 处 其 长 度 为 78 848m, 在 两 极 则 为 零 。 


4. 地 球 椭 球 体 表面 上 的 梯形 面积 


计算 地 球 椭 球体 表面 上 的 梯形 面积 ,就 是 求 定 以 两 条 子午 线 和 两 条 平行 圈 为 
界 的 椭 球 体 表面 面积 。 

如 图 3.10 所 示 , 在 椭 球 体 表面 上 设 有 两 条 无 穷 接 近 的 子午 圈 PB4AP 和 
PCDP; ,其 经 度 各 为 + dh; 另 外 有 两 条 无 穷 接 近 的 平行 圈 TBCS 和 QADR ,其 
纬度 各 为 p、p + dp。 它 们 构成 一 个 无 穷 小 的 梯形 ABCD。 

从 图 3.10 中 可 以 看 出 ,此 梯形 的 边 长 就 是 子午 圈 和 平行 圈 的 弧 长 , 故 

AB = CD = Mdp 
BC ~ AD = rdA = 和 cospdA 
由 此 ,这 个 微分 梯形 面积 ABCD 可 以 写成 
dT = MNcospdadg (3.21) 

如 果 所 计算 的 面积 为 经 度 41 与 42 的 两 条 经 线 及 纬度 为 pl 与 pz 的 两 条 纬 线 

所 包围 的 梯形 , 则 其 面积 为 


A 
T= |*|® MNcospdpda (3.22) 
Al ~ Ps 


将 式 (3.8)、 式 (3.9) 代 入 得 


| ee dA (3.23) 
1 — esin’ 9) 
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图 3.10 地 球 椭 球体 表面 上 的 梯形 面积 
积分 并 经 过 整理 后 得 


了 = 天 |Asin Poosg, Bsin SP cos3 gp 








+ Csin :52eos59 — Dsin core + (3.24) 
P1+ 92 
式 中 ,Ap = 92 - 91, gm = ;AP , pm 为 弧度 
K =2a’°(1 ~ e2)(42 — 41) 
A=1+ $e?+ Be +t est 
ey 
B=6e + 让。 + ji6e 十 
C Sd 二 去 e6 十 
80 16 
a 
OS 


若 令 42 一 A1=1 弧度 , pl=0,92= 9p, 则 得 经 差 一 个 弧度 、 纬 度 自 赤道 到 纬度 
为 9 的 纬 线 所 构成 的 椭 球 体面 的 梯形 面积 。 


3.4.3 兰 勃 特 投影 
1. 兰 勃 特等 角 投 影 简介 


兰 勃 特等 角 投 影 , 在 双 标 准 纬 线 下 是 一 “等 角 正 轴 制 圆锥 投影 ”, 由 德国 数学 家 
兰 勃 特 (J.H.Lambert) 在 1772 年 拟定 。 设 想 用 一 个 正 圆 锥 割 于 球面 两 标准 纬 线 ， 
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应 用 等 角 条 件 将 地 球面 投影 到 圆锥 面 上 ,然后 沿 一 母线 展开 , 即 为 兰 勃 特 投 影 平 
面 。 兰 勃 特等 角 投 影 后 纬 线 为 同心 圆 圆 弧 ,经 线 为 同心 圆 半径 。 兰 勃 特 是 后 面 介 
绍 的 墨 卡 托 (Mercator) 投 影 的 一 个 极端 特例 。 

兰 勃 特 投 影 采 用 双 标 准 纬 线 相 割 ,与 采用 单 标准 纬 线 相 切 比 较 , 其 投影 变形 小 
而 均匀 , 兰 勃 特 投 影 的 变形 分 布 规律 是 :@ 角 度 没有 变形 。@ 两 条 标准 纬 线 上 没有 
任何 变形 。@ 等 变形 线 和 纬 线 一 致 , 即 同 一 条 纬 线 上 的 变形 处 处 相等 。 田 在 同一 
经 线 上 ,两 标准 纬 线 外 侧 为 正 变形 (长 度 比 大 于 1) ,而 两 标准 纬 线 之 间 为 负 变 形 
(长 度 比 小 于 1), 因 此 ,变形 比较 均匀 ,变形 绝对 值 也 比较 小 。@ 同 一 纬 线 上 等 经 
差 的 线段 长 度 相 等 ,两 条 纬 线 间 的 经 纬 线 长 度 处 处 相等 。 


2. 兰 勃 特等 角 投影 坐标 系 


以 图 幅 的 原点 经 线 (一 般 是 中 央 经 线 Lo) 作 为 纵 坐标 X 轴 , 原 点 经 线 与 原点 
纬 线 (一 般 是 最 南端 纬 线 ) 的 交点 作为 原点 ,过 此 点 的 切线 作为 模 坐标 了 轴 , 构成 
兰 勃 特 平面 直角 坐标 系 。 
3. 兰 勃 特等 角 投 影 正 反 解 公式 

1) 兰 勃 特等 角 投 影 正 解 公 式 


(B,L) 一 (X,Y 了), 原 点 纬度 Bo ,原点 经 度 Lo, 第 一 标准 纬 线 Bi ,第 二 标准 续 
线 B,: 

XN = ro 一 rcosO 
YE = rsinO 
cosB 

1 一 e'sin2B 

ee tan 人 于 -2)/( einB | 
4 2 1 + esinB 


ln( mB AmB, ) 


mm 一 


In( tB, / Bp, ) 
F= mp, A( nt ) 
r = aFYr” 
0= n(L— Lo) 
式 中 ,ro 为 原点 纬 线 处 的 + 值 ;mp 和 ms 为 标准 纬 线 Bi 和 B, 处 的 m 值 ;zp 和 
tp, 为 标准 纬 线 Bl 和 B; 处 的 上 值 。 
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2) 兰 孝 特等 角 投影 反 解 公式 


(X,Y 了 ) 一 (B,L), 原 点 纬度 Bo, 原 点 经 度 Lo, 第 一 标准 纬 线 Bi1, 第 二 标准 纬 
线 B,， 
1 ~ esinB 5 
B= 1+ | 
= 0 /n+ Lo 
六 =+V 于 + (ro 一 Xw) 符号 与 n 相同 ,sgn(n) 


六 3 全 (raFy)z 


一 2arctan| 7 ( 








0 = arctan 
ro 一 XN 


式 中 ,参数 同 兰 勃 特等 角 投 影 正 解 公式 ;B 通过 迭代 获取 。 


3.4.4 墨 卡 托 投影 
1. 黑 卡 托 投影 简介 


墨 卡 托 (Mercator) 投 影 ,是 一 种 “等 角 正 切 圆 柱 投影 ”, 由 荷兰 地 图 学 家 墨 卡 托 
(Gerhardus Mercator,1512 一 1594 年 ) 在 1569 年 拟定 。 假 设 地 球 被 围 在 一 中 空 的 
圆柱 里 ,其 标准 纬 线 与 圆柱 相 切 接触 ,然后 再 假想 地 球 中 心 有 一 蔓 灯 ,把 球面 上 的 
图 形 投影 到 圆柱 体 上 ,再 把 圆柱 体 展开 ,这 就 是 一 幅 选 定 标准 纬 线 上 的 “ 墨 卡 托 投 
影 " 绘 制 出 的 地 图 。 

墨 卡 托 投 影 没有 角度 变形 ,由 每 一 点 向 各 方向 的 长 度 比 相等 , 它 的 经 纬 线 都 是 
平行 直线 , 且 相 交 成 直角 ,经 线 间隔 相等 , 纬 线 间隔 从 标准 纬 线 向 两 极 逐 渐 增 大 。 
墨 卡 托 投影 的 地 图 上 长 度 和 面积 变形 明显 ,但 标准 纬 线 无 变形 ,从 标准 纬 线 向 两 极 
变形 逐渐 增 大 ,但 因为 它 具 有 各 个 方向 均等 扩大 的 特性 ,保持 了 方向 和 相互 位 置 关 
系 的 正确 。 

在 地 图 上 保持 方向 和 和 角度 的 正确 是 墨 卡 托 投影 的 优点 , 墨 卡 托 投 影 地 图 常用 
作 航 海 图 和 航空 图 ,如 果 循 着 墨 卡 托 投影 图 上 两 点 间 的 直线 航行 ,方向 不 变 可 以 一 
直到 达 目 的 地 ,因此 它 对 船 舰 在 航行 中 定位 、 确 定 航向 都 具有 有 利 条 件 ,给 航海 者 
带 来 很 大 方便 。 


2. 墨 卡 托 投 影 坐 标 系 


取 零 子午 线 或 自 定义 原点 经 线 ( 工 o) 与 赤道 交点 的 投影 为 原点 , 零 子午 线 或 自 
定义 原点 经 线 的 投影 为 纵 坐 标 X 轴 ,赤道 的 投影 为 横 坐 标 立轴 ,构成 墨 卡 托 投影 
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平面 直角 坐标 系 。 
3. 墨 卡 托 投影 正 反 解 公 式 


了 墨 卡 托 投影 正解 公式 
(也 , 工 ) 一 (X,Y) ,标准 纬度 Bo ,原点 纬度 为 零 , 原 点 经 度 Lo 











nm 8B Ce 
三 人 亲 全 和 ca 
A Kin| ten 4 > i 
YE -3 K(L x Lo) 
2/ 
K= NB,cos( Bo) 二 a x cos( Bo) 


V1 + ecos (Bo) 
2) 墨 卡 托 投影 反 解 公式 
(X,Y) 一 (B,L), 标 准 纬度 Bo, 原 点 纬度 为 零 , 原 点 经 度 Lo 
(3%) 8) (Eg)) 


YE 
L=K+io 


式 中 ,exp 为 自然 对 数 底 ;纬度 B 通过 和 迭代 计算 很 快 就 收银 了 。 





B = 工 - 2arctan(exp 


2 


3.4.5 高 斯 - 克 吕 格 投影 
1. 高 斯 - 克 吕 格 投影 简介 


高 斯 - 克 如 格 (Gauss-Kruger) 投 影 是 一 种 “等 角 横 切 圆柱 投影 ", 由 德国 数学 
家 、 物 理学 家 、 天 文学 家 高 斯 (Carl Friedrich Gauss,1777 一 1855 年 ) 于 19 世纪 20 年 
代 拟 定 , 后 经 德国 大 地 测量 学 家 克 吕 格 (Johannes Kruger,1857 一 1928 年 ) 于 1912 
年 对 投影 公式 加 以 补充 , 故 名 。 从 几何 意义 上 来 看 ,就 是 假想 用 一 个 椭圆 柱 套 在 地 
球 椭 球体 外 面 ,并 与 某 一 子午 线 相 切 ( 此 子午 线 称 中 央 子 午 线 或 中 央 经 线 ) ,椭圆 柱 
的 中 心 轴 位 于 椭 球 的 赤道 上 ,如 图 3.11 所 示 , 再 按 高 斯 - 克 吕 格 投影 所 规定 的 条 
件 , 将 中 央 经 线 东西 各 一 定 的 经 差 范 围 内 的 经 纬 线 交 点 投影 到 椭圆 柱 面 上 ,并 将 
此 圆柱 面 展 为 平面 , 即 得 本 投影 。 

高 斯 - 克 吕 格 投影 后 , 除 中 央 经 线 和 赤道 为 直线 外 ,其 他 经 线 均 为 对 称 于 中 央 
经 线 的 曲线 。 高 斯 - 克 吕 格 投影 没有 角度 变形 ,在 长 度 和 面积 上 变形 也 很 小 , 中央 
经 线 无 变形 , 自 中 央 经 线 向 投影 带 边缘 ,变形 逐渐 增加 ,变形 最 大 处 在 投影 带 内 赤 
道 的 两 端 。 由 于 其 投影 精度 高 ,变形 小 ,而 且 计 算 简便 (各 投影 带 坐 标 一 至 ,只 要 算 
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3.11 高 斯 - 克 吕 格 投影 


出 一 个 带 的 数据 ,其 他 各 带 都 能 应 用 ) ,因此 在 大 比例 尺 地 形 图 中 应 用 ,可 以 满足 军 
事 上 各 种 需要 ,并 能 在 图 上 进行 精确 的 量 测 计算 。 
按 一 定 经 差 将 地 球 椭 球面 划分 成 若干 投影 带 , 这 是 高 斯 投影 中 限制 长 度 变形 
的 最 有 效 方法 。 分 带 时 既 要 控制 长 度 变形 使 其 不 大 于 测 图 误差 ,又 要 使 带 数 不 臻 
过 多 以 减少 换 带 计算 工作 , 据 此 原则 将 地 球 椭 球 面 沿 子午 线 划 分 成 经 差 相 等 的 瓜 
辩 形 地 杏 ,以 便 分 带 投 影 。 通 常 按 经 差 6 "或 3' 分 为 六 度 带 或 三 度 带 。 
六 度 带 是 从 0" 子 午 线 每 隔 6 的 经 度 差 自 西向 东 分 带 , 带 号 依次 编 为 第 1， 
2,…,60 带 。 其 带 号 与 相应 的 中 央 子 午 线 经 度 Lo 的 关系 为 
Lo=6n-3 
n= (Lo+3)/6 
三 度 带 是 在 六 度 带 的 基础 上 分 成 的 , 它 的 中 央 子 午 线 与 六 度 带 的 中 央 子 午 线 
和 分 带子 午 线 重合 , 即 自 1.5 子午线 起 每 隔 经 差 3" 自 西向 东 分 带 , 带 号 依次 编 为 
第 1,2,…,120 带 ,其 带 号 与 中 央 子 午 线 经 度 Lo 的 关系 为 : 
Lo = 3n” 
n = Lo/3=2n-l1 


2. 高 斯 -克昌 格 投影 坐标 系 


取 零 子午 线 或 自 定义 原点 经 线 (Lo) 与 赤道 交点 的 投影 为 原点 , 零 子 午 线 或 自 
定义 原点 经 线 的 投影 为 纵 坐标 X 轴 , 赤 道 的 投影 为 横 坐 标 Y 轴 , 构 成 高 斯 -克昌 
格 投影 平面 直角 坐标 系 。 


3. 高 斯 - 克 如 格 投 影 正 反 解 公式 
(1) 高 斯 - 克 吕 格 投影 正解 公式 
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(B,L) 一 (X,Y), 原 点 经 度 Lo 


T= Xo+ 


1 
y= Nmo+ ee 一 让 十 驴 )Nmo? 十 2 — 1822 + 1 —147 — 587t2) Nmb 


式 中 ， 


则 


设 参考 椭 球 的 长 半 轴 为 a ,第 一 偏心 率 为 e 


2 


可 | 


LT Nimio + 支 G5 t+ 97 +47 


720 


120 


Xo = Co B+ cosB(CisinB + CysinsB + Casin5B) 
其 中 ， a i 经 度 为 Lo, 再 令 


”512 
_315 


16 384° 


693 





.13 027 


i 


se 


/三 二 一 工 0 





N= a/v1- esiwB 
,采用 符号 
11 025 a 
“本 384° 
2205 8 72 765 a10 
2048® ”65 536° 


10 359 1 
16 384° 


45 

本“ 
325 6 
512 

，2205 。， 
4096° 
315 8 , 31 185 1 
2048< 13 072< 

8 4 3465 10 

165 536 


175 8 
256“ 


43 659 1o 
”65 536° 





16° 
105 8 











eo 


6067: 


) Ntmé + 61 — S82 + £4) Nemé 
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则 
Co =a 
Cl =28+47+66 
一 (87y + 326) 
C3 =326 
(2) 高 斯 - 克 吕 格 投影 反 解 公式 
(X,Y)>(B, > 原点 经 度 Lo 


1 4 

B=Bt= 2 由 A ) 十 : 24(5 十 3 好 于 大 过 9 Ye 总) 
4 
-0(61 十 90 妈 437 ) V? ) 


四 2 2 (a 1 2 4 
| 6 (1 +2sf + wf) i 十 1045 + 28zf + 24z4 
a 
+ 6 + en (mam)(S) 
L=Lo+1/ 
式 中 ,Bi 表示 地 点 纬度 , 即 以 z 作为 赤道 起 算 的 子午 线 所 对 应 的 纬度 值 ,其 值 为 
Bi = BY + cosBY(KisinB? — K2sin3B + Kssin’ BY + Kssin’ BY) 


zr 
BY = pe 
天 1 = 2pBr + 47Yr+ 66r 
= 87Yr + 3261 
Ks = 3261 


3.4.6 通用 横 轴 妓 卡 托 投 影 


通用 横 轴 墨 卡 托 投影 (universal transverse Mercator projection) 取 前 面 3 个 英 
文字 母 大 写 而 称 UTM 投影 。 它 与 高 斯 - 克 吕 格 投影 相 比较 ,这 两 种 投影 之 间 仅 存 
在 着 很 少 的 差别 ,从 几何 意义 看 ,UTM 投影 属于 横 轴 等 角 割 圆柱 投影 ,圆柱 割地 
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球 于 两 条 等 高 圈 ( 对 球体 而 言 ) 上 ,投影 后 两 条 割 线 上 没有 变形 ,中央 经 线 上 长 度 比 
x 小 于 1( 假 定 p=0.9996) (图 3.12)。 





图 3.12 通用 横 轴 墨 卡 托 投影 


由 此 UTM 投影 的 直角 坐标 (z,y) ,长度 比 计算 公式 及 子午 线 收敛 角 计算 公 
式 , 也 可 依照 高 斯 - 克 吕 格 投影 求 得 。 
直角 坐标 公式 ，; 


x = 0.9996[ Xo + > Nem 区 (5 — 12 +97 +47) Nimé 


2 ry 2 4 6 
十 也 (6 S8 + t4) Nizag] 


|y = 0.9996[ Nmo + 二 (1 -12 + 7)Nme + 5 — 18:2 +z4 


— 147 — 587 7?) Nm$] 
上 式 中 所 用 的 符号 同 高 斯 -克昌 格 投 影 。 


思 考题 


. 编写 程序 实现 地 图 左 斜体 和 壬 肩 体 注 记 的 绘制 。 
. 编 与 程序 实现 兰 勃 特等 角 投影 的 正解 计算 。 

. 编写 程序 实现 置 卡 托 投影 的 正解 计算 。 

. 编写 程序 实现 墨 卡 托 投影 的 反 解 计算 。 

. 编写 程序 实现 高 斯 - 克 吕 格 投影 的 正解 计算 。 

. 编写 程序 实现 高 斯 - 克 吕 格 投影 的 反 解 计算 。 


OW D5- 


第 4 半 空间 数据 等 换算 法 


矢量 结构 数据 与 栅 格 结构 数据 的 相互 转换 ,是 地 理 信息 系统 的 基本 功能 之 一 ， 
目前 已 经 发 展 了 许多 高 效 的 转换 算法 。 但 是 ,从 栅 格 数据 到 矢量 数据 的 转换 ,特别 
是 扫描 图 像 的 自动 识别 ,仍然 是 目前 研究 的 重点 。 


4.1 矢量 数据 向 栅 格 数据 转换 
4.1.1 矢量 点 的 栅 格 化 


由 图 4.1, 不 难 理解 ,将 点 的 矢量 坐标 x、y 换算 为 机 格 行 、 列 号 的 公式 为 
3y0 一 y 
a 


ea (4.1) 





J=1+| 


D., 





图 4.1 矢量 数据 点 转换 为 栅 格 数据 
式 中 ,D,、D, 分 别 为 一 个 栅 格 的 宽 和 高 , 当 栅 格 通常 为 正方 形 时 D, = D,;[ ] 表 示 
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取 整 。 
4.1.2 矢量 线 的 栅 格 化 


在 矢量 数据 中 ,曲线 是 由 折线 来 和 逼近 的 。 因 此 只 要 说 明了 一 条 直线 段 如 何 被 
栅 格 化 ,对 任何 线 划 的 栅 格 化 过 程 也 就 清楚 了 。 图 4.2 说 明了 线 划 栅 格 化 的 三 种 
不 同方 法 , 即 八方 向 栅 格 化 、 全 路 径 栅 格 化 和 恒 密 度 栅 格 化 。 


-二 上 二 








SS 国 国 面 
RR TTTTTTH 
(b) 全 路 径 栅 格 化 (0) 恒 密 度 栅 格 化 


4.2 同一 线段 的 三 种 不 同 的 栅 格 化 方案 


1. 八方 向 栅 格 化 


根据 矢量 的 倾角 情况 ,在 每 行 或 每 列 上 ,只 有 一 个 像 元 被 “ 涂 黑 ”( 赋 予 不 同 于 
背景 的 灰 度 值 )。 其 特点 是 在 保持 八方 向 连通 的 前 提 下 ,机 格 影像 看 起 来 最 细 , 不 
同 线 划 间 最 不 易 “ 粘 连 ”。 

如 图 4.3 所 示 , 假 定 1 和 2 为 一 条 直线 











a 
ee eo te El NY (Ue 
1 1 2， DSS 

万 ) ,并 将 它们 “ 涂 黑 "。 然 后 求 出 这 两 个 端点 Ep 

位 置 的 行 数 差 和 列 数 差 。 [HH 
车 行 数 差 大 于 列 数 差 , 则 逐 行 求 出 本 行 上 上 二 上 上 上 HS 

中 心 线 与 过 这 两 个 端点 的 直线 的 交点 :上 上 上 二 中 直上 有 有 秆 

yy 二 y 中 心 线 


T=(y—- yb+ri 图 4.3 ”矢量 线段 的 八方 向 顶 格 化 
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之 2 Xl 


式 中 ,0= | ,并 按 式 (4.1) 将 其 所 在 的 栅 格 “ 涂 黑 ”。 
若 行 数 差 小 于 或 等 于 列 数 差 , 则 膛 列 求 出 本 列 中 心 线 与 过 这 两 个 端点 的 直线 
的 交点 : 





工 二 工 中 心 线 
y=(z— Zz +yl 
式 中 ,6 = 池 一, 仍 按 式 (4.1) 将 其 所 在 的 骨 格 “ 涂 黑 "。 
yy Xl 
这 里 ,之 所 以 要 分 两 种 情况 处 理 , 是 为 了 使 所 产生 的 被 “ 涂 黑 " 的 栅 格 均 相 互 连 
通 ,避免 线 划 的 间断 现象 。 
2. 全 路 径 栅 格 化 


这 里 介绍 一 种 “分 带 法 ”, 即 按 行 计算 起 始 列 号 和 终止 列 号 (或 按 列 计算 起 始 行 
号 和 终止 行 号 ) 的 方法 ,如 图 4.4 所 示 , 用 分 带 法 进行 矢量 向 栅 格 的 转换 。 


(xo,y0) 





0 矢量 坐标 数据 的 原点 。 
图 4.4 用 分 带 法 进行 矢量 向 栅 格 的 转换 


基于 矢量 的 首 末 点 和 倾角 a 的 大 小 ,可 以 在 带 内 计算 出 行 导 (i,, i) 或 列 号 
(ja ,je): 

当 |zxs 一 xi|<<|ys 一 y1| 时 ,计算 行 号 i ,i; 

当 |zs 一 zi 之 |y2 一 yi1l 时 ,计算 列 号 j,,j。。 

下 面 给 出 | zz -xi| 之 |yz 一 yi| 时 的 计算 过 程 。 

设 当 前 处 理 行为 第 i 行 , 栅 格 边 长 为 m。 

(1) 计算 矢量 倾角 a 的 正切 
yz2— 1 
TX2 1 





tana 


(2) 计算 起 始 列 号 ; 
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j= [Do) ml] 
(3) 计算 终止 列 号 7 


一 277a 一 
i 


tana 

(4) 将 第 i 行 从 js 列 开始 到 j。 列 为 止 的 中 间 所 有 栅 格 “ 涂 黑 ”; 

(5) 若 当前 处 理 行 不 是 终止 行 , 则 把 本 行 终止 列 号 7. 作为 下 行 的 起 始 列 号 j,; 
行 号 i 增加 1, 并 转 (3)。 和 否则 本 矢量 段 栅 格 化 过 程 结 束 。 

要 注意 , 需 将 矢量 段 首 点 和 末 点 所 在 的 概 格 列 号 分 别 作为 第 一 行 的 ;}。 和 最 后 
一 行 的 7. 的 限制 条 件 , 以 免 使 栅 格 影像 变 长 失真 ; 当 首 .未 点 的 行 号 相同 时 , 则 直 
接 在 首 、 末 两 点 j, 与 j, 间 “ 涂 黑 " 就 行 ; 若 ys > y1, 则 需 将 首 、 末 点 号 互 换 后 再 使 用 
上 式 。 

当 要 以 任何 方向 探测 栅 格 影像 的 存在 或 者 需要 知道 矢量 可 能 只 出 现在 哪些 栅 
格 所 覆盖 的 范围 时 ,全 路 径 栅 格 化 数据 结构 最 为 理想 。 





4.1.3 矢量 面 的 顶 格 化 


矢量 面 格式 向 栅 格 面 格式 转换 又 称 为 多 边 形 填充 ,就 是 在 矢量 表示 的 多 边 形 
边界 内 部 的 所 有 李 格 点 上 赋 以 相应 的 多 边 形 编码 ,从 而 形成 类 似 如 图 4.5 所 示 的 


栅 格 数据 阵列 。 
00000000 00000000 04477777 
00000000 00060000 44444777 
00002000 06606000 44448877 
00000000 00000600 00488877 
00000000 00000600 00888878 
00000000 00000600 00088888 
00000000 00000060 00008888 
00000000 00000000 00000888 
(四 点 (b) 线 (0) 面 


图 4.5 点 \ 线 区域 的 格 网 
1. 内 部 点 扩散 算法 


该 算法 由 每 个 多 边 形 一 个 内 部 点 (种 子 点 ) 开 始 , 向 其 8 个 方向 的 邻 点 扩散 , 判 
断 各 个 新 加 人 点 是 否 在 多 边 形 边界 上 ,如果 是 在 边界 上 , 则 该 新 加 入 点 不 作为 种 子 
点 ,否则 把 非 边 界 点 的 邻 点 作为 新 的 种 子 点 与 原 有 种 子 点 一 起 进行 新 的 扩散 运算 ， 
并 将 该 种 子 点 赋 以 该 多 边 形 的 编号 。 重 复 上 述 过 程 直到 所 有 种 子 点 填 满 该 多 边 形 
并 遇 到 边界 停止 为 止 。 扩 散 算法 程序 设计 比较 复杂 ,并 且 在 一 定 的 栅 格 精度 上 ,如 
果 复 杂 图 形 的 同一 多 边 形 的 两 条 边界 落 在 同一 个 或 相 邻 的 两 个 栅 格 内 ,会 造成 多 
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边 形 不 连通 ,这 样 一 个 种 子 点 不 能 完成 整个 多 边 形 的 填充 。 
2. 射线 算法 和 扫描 算法 


射线 算法 可 逐 点 判断 数据 栅 格 点 在 某 多 边 形 之 外 或 在 多 边 形 之 内 ,由 待 判 点 
向 图 外 某 点 引 射 线 ,判断 该 射线 与 某 多 边 形 所 有 边界 相交 的 总 次 数 ,如 相交 偶数 
次 , 则 待 判 点 在 该 多 边 形 外 部 ;如 为 奇数 次 , 则 待 判 点 在 该 多 边 形 内 部 (图 4.6)。 
采用 射线 算法 ,要 注意 的 是 :射线 与 多 边 形 边界 相交 时 ,有 一 些 特 殊 情 况 会 影响 交 
点 的 个 数 ,必须 予以 排除 (图 4.7)。 





2 外 部 点 e 内 部 点 ?交点 个 数 


图 4.6 射线 算法 


(a) 相 切 (b) 相声 (0) 相 切 


机 


(d) 重合 (6) 不 连通 


图 4.7 射线 算法 的 特殊 情况 
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扫描 算法 是 射线 算法 的 改进 ,将 射线 改 为 沿 栅 格 阵列 行 或 列 方向 扫描 线 , 判 断 
与 射线 算法 相似 。 扫 描 算 法 省 去 了 计算 射线 与 多 边 形 边界 交点 的 大 量 运 算 , 大 大 
提高 了 效率 。 


3. 边界 代数 算法 


边界 代数 多 边 形 填充 算法 是 一 种 基于 积分 思想 的 矢量 格式 向 机 格格 式 转 换算 
法 , 它 适 合 于 记录 拓扑 关系 的 多 边 形 矢量 数据 转换 为 栅 格 结构 。 图 4.8 所 示 转 换 
单个 多 边 形 的 情况 ,多边 形 编号 为 a, 模仿 积分 求 多 边 形 区 域 面积 的 过 程 ,初始 化 
的 栅 格 阵列 各 栅 格 值 为 零 ,以 概 格 行列 为 参考 坐标 轴 , 由 多 边 形 边界 上 某 点 开始 顺 
时 针 搜 索 边 界线 , 当 边 界 上 行 时 [图 4.8(a)], 位 于 该 边界 左 侧 的 具有 相同 行 坐标 
的 所 有 栅 格 被 减 去 a; 当 边 界 下 行 时 [图 4.8(b)] ,该 边界 左边 (前 进 方向 看 为 右 侧 ) 
所 有 根 格 点 加 一 个 值 3, 边界 搜索 完毕 则 完成 了 多 边 形 的 转换 。 

事实 上 ,每 幅 数 字 地 图 都 是 由 多 个 多 边 oo oo 0 00 

形 区 域 组 成 的 ,如 果 把 不 属于 任何 多 边 形 的 2813 53 

区 域 (包含 无 穷 远 点 的 区 域 ) 看 成 编号 为 零 -有 0 00 
0000 
) 


00000 
aaal00 
aaal0o0 
中 上 
的 特殊 的 多 边 形 区 域 , 则 图 上 每 一 条 边界 弧 00 0000 
段 都 与 两 个 不 同 编号 的 多 边 形 相 邻 , 按 弧 段 
的 前 进 方向 分 别称 为 左右 多 边 形 ,可 以 证 图 4.8 单个 多 边 形 的 转换 
明 ,对 于 这 种 多 个 多 边 形 的 矢量 向 顶 格 转换 
问题 ,只 需 对 所 有 多 边 形 边界 弧 段 做 如 下 运算 而 不 考虑 排列 次 序 : 当 边界 弧 段 上 行 
时 ,该 弧 段 与 左 图 框 之 间 栅 格 增加 一 个 值 ( 左 多 边 形 编号 减 去 右 多 边 形 编号 ); 当 边 
界 弧 段 下 行 时 ,该 弧 段 与 左 图 框 之 间 栅 格 增加 一 个 值 ( 右 多 边 形 编号 减 去 左 多 边 形 
编号 ) 。 
以 图 4.9 为 例 , 选 择 两 个 邻 域 多 边 形 的 边界 代数 转换 过 程 进 行 步骤 说 明 。 
由 图 4.9 和 表 4.1 可 知 。 


{a 


表 4.1 线 号 与 左右 多 边 形 号 的 对 应 关系 





线 号 左 多 边 形 右 多 边 形 
I 0 nl 
I n2 0 
亚 n3 n2 
NV ni n2 
V n3 0 
V n3 nl 


图 4.9 多 个 多 边 形 示意 图 
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(1) 对 多 边 形 nj1: 线 I 上 行 -nj, 下 行 + ni; 线 上行 + nl1; 线 WY 下行 + n1。 

(2) 对 多 边 形 ”2 : 线 下 上 行 + ns, 下 行 -n2; 线 上 行 一 ns; 线 肝 上行。 

(3) 对 多 边 形 z3: 线 人 下 行 - xz3, 线 下 上 行 + n3; 线 V 下 行 -n3, 上 行 + n3o 

对 所 有 运算 按 线 号 进行 排列 ,把 图 外 区 域 作 为 编号 为 零 的 区 域 参加 计算 ,下 表 
后 两 行内 标 出 的 为 相应 线 的 左 或 右 多 边 形 。 





线 号 前 进 方向 左 右 

上 行 +0 一 ?21 
线 I 

下 行 -0 + ni 

上 行 + nz -0 
线 I 2 

下 行 一 222 +0 
线 亚 上 行 + ns 72 
线 休 上 行 + ni 汪汪 

上 行 + ns -0 
线 V 有 

下 行 ns #0 
线 克 下 行 一 m3 tn 


由 此 进一步 说 明 边界 代数 算法 的 基本 思想 :对 每 幅 地 图 的 全 部 具有 左右 多 边 
形 编号 的 边界 红 段 , 沿 其 前 进 的 方向 逐个 搜索 , 当 边 界 上 行 时 ,将 边界 线 位 置 与 左 
图 框 之 间 的 网 格 点 加 上 一 个 值 = 左 多 边 形 编号 - 右 多 边 形 编号 ; 当 边 界线 下 行 时 ， 
将 边界 线 位 置 与 左 图 框 的 栅 格 点 加 上 一 个 值 = 右 多 边 形 编号 - 左 多 边 形 编号 ,而 
不 管 边 界线 的 排列 顺序 。 

两 个 邻 域 多 边 形 的 边界 代数 转换 过 程 如 图 4.10 所 示 。 

边界 代数 法 与 前 述 其 他 算法 的 不 同 之 处 ,在 于 它 不 是 逐 点 判断 与 边界 的 关系 
完成 转换 ,而 是 根据 边界 的 拓扑 信息 ,通过 简单 的 加 减 代 数 运算 将 边界 位 置信 息 动 
态 地 赋 给 各 栅 格 点 ,实现 了 矢量 格式 到 栅 格 格式 的 高 速 转换 ,而 不 需要 考虑 边界 与 
搜索 轨迹 之 间 的 关系 ,因此 算法 简单 可靠 性 好 ,各 边界 弧 段 只 被 搜索 一 次 ,避免 了 
重复 计算 。 

但 是 这 并 不 意味 着 边界 代数 法 可 以 完全 替代 其 他 算法 ,在 某 些 场 合 下 ,还 是 要 
采用 种 子 填充 算法 和 射线 算法 ,前 者 应 用 于 在 栅 格 图 像 上 提取 特定 的 区 域 ;后 者 则 
可 以 进行 点 和 多 边 形 关系 的 判断 。 
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图 4.10 两 个 邻 域 多 边 形 的 边界 代数 转换 过 程 及 结果 


2 栅 格 数据 向 矢量 数据 转换 


4 


的 关系 


小 


与 矢量 点 坐 


栅 格 点 坐标 


4.2.1 


将 其 行列 号 1,J 转换 为 其 中 心 点 的 z,y 的 公 


瑟 ， 


点 A 而 言 


对 于 任意 一 个 栅 格 


式 如 下 


RB 六 
QA 
个 小 
nn ww 
OS 
1 | 
mm 
>、 
不 | 
b= Lm] 
站 
! | 
SB 


| 


式 中 ,各 符号 的 合 义 与 式 (4.1) 同 ,如 图 4.11 所 
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图 4.11 栅 格 点 坐标 与 矢量 点 坐标 的 关系 


4.2.2 栅 格 数据 矢量 化 的 基本 步骤 


栅 格 格式 向 矢量 格式 转换 就 是 提取 以 相同 的 编号 的 栅 格 集合 表示 的 边界 边界 
的 拓扑 关系 和 多 边 形 ,并 生成 由 多 个 小 直线 段 组 成 的 表示 矢量 格式 边界 线 的 过 程 。 

栅 格 格式 向 矢量 格式 转换 通常 包括 以 下 4 个 基本 步骤 : 

(1) 边界 提取 :采用 高 通 滤波 将 栅 格 图 像 二 值 化 或 以 特殊 值 标识 边界 点 。 

(2) 边界 线 追踪 :对 每 个 边界 弧 段 由 一 个 结 点 向 男 一 个 结 点 搜索 ,通常 对 每 个 
已 知 边 界 点 需 沿 除 了 进入 方向 的 其 他 7 个 方向 搜索 下 一 个 边界 点 ,直到 连 成 边界 
弧 段 。 

(3) 拓扑 关系 生成 :对 于 矢量 表示 的 边界 弧 段 数据 ,判断 其 与 原 图 上 各 多 边 形 
的 空间 关系 ,以 形成 完整 的 拓扑 结构 并 建立 与 属性 数据 的 联系 。 

(4) 去 除 多 余 点 及 曲线 圆滑 ;由 于 搜索 是 逐个 栅 格 进行 的 ,必须 去 除 由 此 造成 
的 多 余 点 记录 ,以 减少 数据 元 余 ;搜索 结果 ,曲线 由 于 栅 格 精度 的 限制 可 能 不 够 圆 
滑 , 需 采 用 一 定 的 插 补 算法 进行 光滑 处 理 , 常 用 的 算法 有 线形 迭代 法 ,分 段 三 次 多 
项 式 插值 法 , 正 轴 抛物 线 平均 加 权 法 , 斜 轴 抛物 线 平均 加 权 法 , 样 条 函数 插值 法 。 


4.2.3 线 状 栅 格 数据 的 细 化 
线 状 栅 格 数 据 一 般 具 有 一 定 粗 度 且 线 划 本 身 往 往 呈 粗细 不 匀 的 状态 。 线 状 栅 


格 数据 需要 细 化 ,以 提取 其 中 轴线 ,这 是 因为 :中 轴线 是 栅 格 数 据 曲线 的 标准 化 
存储 形式 ; 己 实现 细 化 是 将 栅 格 曲线 矢量 化 的 前 提 ;@@ 在 有 些 算法 中 可 以 提高 计算 
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精度 。 

对 于 线 状 栅 格 数据 的 细 化 ,算法 有 多 种 , 目前 可 归纳 为 两 大 类 :第 一 类 是 基于 
距离 变换 ,首先 得 到 骨架 像 元 ,然后 跟踪 距离 变换 图 中 的 “ 山 峭 线 "( 即 在 局 部 范围 
内 灰 度 值 最 大 的 像 元 系列 ) ,并 将 其 作为 中 轴线 ;第 二 类 是 基于 在 不 破坏 栅 格 拓扑 
连通 性 的 前 提 下 , 按 对 称 的 原则 删除 影像 边缘 的 栅 格 点 。 具 体 算法 各 举 两 例 : 


1. 用 距离 变换 法 搜寻 中 轴线 


距离 变换 图 是 一 种 栅 格 图 像 , 其 中 每 个 像 元 的 灰 度 值 等 于 它 到 栅 格 地 图 上 相 
邻 物 体 的 最 近 距 离 。 此 时 ,对 于 距离 的 量度 ,用 的 是 四 方向 距离 , 即 所 谓 “ 城 市 街区 
量度 ”(City-Block-Metric) , 它 只 允许 沿 四 个 主 方向 而 不 允许 沿 对 角 方 向 进行 跨 机 
格 的 最 小 路 段 的 计数 ,因此 ,每 个 路 段 为 一 个 像 元 边 长 。 

图 4.12 说 明了 利用 原始 二 值 影像 计算 距离 变换 图 的 算法 ,其 基本 思想 是 反复 
进行 “对 原 图 的 减 细 ” 和 “将 减 细 结 果 与 中 间 结 果 这 两 个 栅 格 图 像 做 算术 全 加 ”这 两 
种 基本 运算 。 其 终止 条 件 可 以 是 “ 若 对 原 图 再 减 细 , 则 将 成 为 全 零 矩 阵 "。 图 4.12 
(f) 就 是 用 上 述 算法 得 到 的 距离 变换 图 。 

上 骨架 图 就 是 从 距离 变换 图 中 提取 出 具有 相对 最 大 灰 度 值 的 那些 像 元 所 组 成 的 
图 像 ,如 图 4.12(g) 所 示 。 

如 果 将 图 4.12(g) 所 示 的 骨架 图 用 比 其 灰 度 值 小 1 的 像 元 数 予以 加 粗 , 就 得 
到 图 4.12(h)。 可 以 看 出 ,其 结果 几乎 等 同 于 原始 图 像 。 因 此 可 以 认为 这 种 骨架 
图 是 原始 图 像 的 简 记 。 这 说 明 ,骨架 图 在 栅 格 数据 的 压缩 存储 中 有 其 重要 作用 。 

将 栅 格 数据 进行 距离 变换 ,获得 距离 变换 图 ,然后 从 骨架 图 中 的 某 一 个 像 元 出 
发 , 沿 两 个 方向 跟踪 邻 域 中 灰 度 值 最 大 的 那个 像 元 ( 若 遇 急 回 头 , 则 说 明 已 跟踪 完 
一 条 线 划 的 一 端 )。 若 灰 度 值 最 大 的 像 元 不 止 一 个 ,但 从 连通 性 来 看 ,只 有 一 组 , 则 
尽量 取 位 于 中 间 的 那个 像 元 跟踪 ; 若 不 止 一 组 , 则 选 能 使 前 进 方向 折 角 较 小 的 那 一 
组 的 中 间 片 像 元 跟踪 ,并 在 跟踪 过 程 中 ,不 断 记录 下 每 个 栅 格 的 行 号 、 列 号 。 对 于 
已 跟踪 过 的 栅 格 像 元 ,通过 加 粗 , 将 本 根 线 划 上 的 所 有 像 元 灰 度 值 置 成 负数 ,以 示 
区 别 , 从 而 可 继续 跟踪 其 他 线 划 上 的 “山脊 线 ”。 


2. 最 大 数值 计算 法 


设 原始 栅 格 数据 如 图 4.13 所 示 。 利 用 原始 栅 格 数据 计算 格 线 交 点 的 V 值 ， 
每 点 的 V 值 是 该 点 左上 、 右 上 、 左 下 、 右 下 4 个 栅 格 灰 度 值 的 和 ,其 中 要 素 栅 格 灰 
度 为 “1” ,背景 顶 格 灰 度 为 "0"。 因 为 每 点 周围 至 多 为 4 个 “1”, 所 以 Vax 二 4， Vmin 
=0( 图 4.13、 图 4.14) ,然后 选取 最 大 V 值 的 点 。 显 然 , 最 大 V 值 点 不 可 能 位 于 
线 划 边缘 ,而 位 于 线 划 内 部 。 如 果 经 一 次 细 化 仍 嫌 太 粗 ,还 可 以 将 所 有 最 大 了 值 
点 的 灰 度 值 重 新 赋 为 1”, 而 将 其 他 V 值 点 的 灰 度 值 重 新 赋 为 “0” ,进而 再 选取 最 
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(D 原 图 + 第 一 次 减 细 结果 + (g) 骨架 图 (h) 骨架 图 的 两 次 加 粗 结果 

第 二 次 减 细 结 果 


图 4.12 中 离 变 换 图 和 骨架 图 及 其 形成 过 程 
大 V 值 点 ,……。 图 4.13 的 原始 机 格 数据 经 本 法 计算 一 次 ,结果 如 图 4.14 所 示 。 
3. 经 典 的 细 化 算法 


在 栅 格 影像 的 细 化 过 程 中 ,一 个 灰 度 值 为 “1 的 像 元 应 不 应 该 置 成 <0” ,可 以 通 
过 考察 其 8 个 邻 域 灰 度 值 的 分 布 格局 来 做 出 决定 。 其 基本 原理 是 ,凡是 去 掉 后 不 
会 影响 原 栅 格 影像 拓扑 连通 性 的 像 元 都 应 去 掉 ; 反 之 , 则 应 保留 。 在 中 心 像 元 的 8 
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图 4.13 矢量 化 前 的 原始 栅 格 影像 
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图 4.14 最 大 数值 计算 法 细 化 过 程 
个 邻 域内 ,分布 格局 共有 28( 即 236) 种 ,但 经 归纳 ,凡是 符合 图 4.15 中 所 示 基 本 格 


局 ( 共 15 种 ) 的 ,其 中 心 像 元 应 予以 保留 。 
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A 不 全 为 “0”， a 人 
“0” ， (=1, 
信友 定 同 旋转 907 的 情况 












四 加 加 二 CA0 (天 12….5) 本题 柄 
oRNNo| 以 有 定向 人 和 3 光 90" oRNN 2 非 零 像 元 “2” 可 有 8 种 位 置 
ool 四 加 加 


(5) (d) 
图 4.15 中 心 像 元 应 保留 的 格局 


其 中 ,图 4.15(d) 中 的 灰 度 值 *2” 表 示 该 像 元 在 前 一 轮 判断 中 已 被 确认 要 保 
留 的 。 

注意 ,图 4.15 中 的 (a) (b)、(c) 给 出 的 实际 上 是 连通 性 条 件 , 如 果 简 单 地 将 它 
依次 用 于 一 幅 图 像 ,那么 一 个 连通 区 域 的 像 元 灰 度 值 将 都 变 为 "0"。 因 此 , 对 于 某 
一 方向 的 细 化 来 说 ,中 心 像 元 的 取舍 决定 ,不 能 立即 表现 





3 |2 
| 为 物理 上 去 除 或 保留 ,而 先 将 中 心 像 元 P 置 为 2( 表 示 此 
1516|7| 为 中 轴线 上 的 像 元 ) 或 3( 表 示 此 为 可 删除 的 像 元 ) ,以 免 


_ 破坏 原始 影像 的 结构 。 

0 为 了 使 被 保留 的 像 元 尽 可 能 位 于 线 划 中 心 ,每 个 细 

的 位 置 编 弛 化 循环 的 内 部 顺序 依次 为 右 侧 . 上 侧 、 左 侧 、 下 侧 。 图 

4.16 表示 出 了 对 一 个 像 元 P 定义 其 近邻 像 元 相对 位 置 所 用 的 编号 ,也 就 是 说 , 一 
个 像 元 的 “0” 的 近邻 就 是 指 与 它 紧 挨 着 的 右 侧 像 元 …… 依 此 类 推 。 


4. 边缘 跟踪 剥皮 法 


这 种 算法 的 基本 思想 是 先导 找到 一 个 位 于 线 划 影像 边缘 上 的 像 元 ,接着 以 此 
像 元 为 中 心 , 按 一 定 顺 序 ( 例 如 , 顺 时 针 方 向 ) SS 
检测 其 8 个 邻 域 的 灰 度 值 。 通 过 这 次 检测 ,可 AS 
以 同时 达到 两 个 目的 ; -是 决定 本 中 心 像 元 应 TSSSS 
不 应 该 被 置 成 “0”; 二 是 找到 与 本 中 心 像 元 相 | SS 
邻 的 边缘 像 元 ,以 便 继续 "剥皮 "和 跟踪 。 TS 

如 图 4.17(a) 所 示 ,假定 当前 被 考察 边缘 外 
点 是 (i -1,7), 以 原 边 缘 点 (i 一 2,;) 作 为 顺 时 图 4.17 边缘 跟踪 剥皮 法 原理 图 
针 8 个 邻 域 检测 起 点 ,围绕 当前 考察 点 (; 1,j) 
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进行 检测 ,凡是 最 后 检测 到 的 , 非 起 始 检测 点 上 的 、 要 素 上 的 像 元 ,就 是 被 跟踪 到 的 
新 的 边缘 点 。 因 此 ;此 时 所 找到 的 新 边缘 点 为 (i,j), 同 样 ,以 (i,j) 为 当前 被 考察 
的 中 心 点 ,为 寻找 新 的 边缘 点 ,从 (i 一 1,7) 开 始 ,做 顺 时 针 的 邻 域 测试 , 按 图 4.17 
(a) 的 情况 ,被 跟踪 的 下 一 个 边缘 点 将 是 (i +1,; +1); 而 按 图 4. 17(b) 的 情况 ， 被 
寻找 到 的 下 一 个 边缘 点 则 是 (i +1,j 一 1)。 

在 检测 过 程 中 ,可 同时 判别 当前 点 (i,j) 是 否 应 该 在 细 化 中 去 掉 。 这 主要 依靠 
在 测试 中 通过 有 条 件 的 计数 ,得 到 除 中 心 像 元 外 ,8 个 邻 域 中 自 相 连通 的 像 元 块 数 
Nas。 如 图 4.17(a) 所 示 , Ns = 1。 这 是 因为 自身 连通 的 像 元 集合 只 有 一 个 , 即 Si 
三 和 i 一 1,7),(i 一 1,j++1),(i,j+1),(i+1,j 二 1)1; 而 如 图 4.17(b) 所 示 , 仍 以 
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图 4.18 全 图 边缘 跟踪 一 次 并 作 标 记 后 的 灰 度 值 情况 
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(i,j) 为 中 心 点 作 同样 的 检测 ,可 得 Ne=2, 因 为 自身 相连 通 的 像 元 集合 有 两 个 ， 
即 Si= (i 一 1,7),(i,j+1),(i+1,j+1)1,Ss=1(i+1,j 一 1)|。 因 此 ,只 要 在 
检测 前 将 Ns 赋 初 值 “0” ,检测 后 判别 一 下 , 若 Ne<2 , 则 当前 被 考察 的 点 (i,j) 可 
以 被 * 剥 " 掉 ; 反 之 , 若 Ne 之 2, 则 不 可 "和 剥 " 去 ,否则 将 破坏 曲线 的 连通 性 。 

跟踪 线 划 栅 格 影像 一 侧 边 缘 的 终止 条 件 是 跟踪 到 了 起 始 像 元 ( 即 跟踪 轨迹 已 
闭合 ) 。 在 整 幅 栅 格 数据 中 还 有 未 被 跟踪 过 的 线 划 边缘 的 条 件 下 ,凡是 在 跟踪 分 析 
过 程 中 ,被 判别 为 应 该 删 掉 的 “1" 像 元 作 上 标记 “3”, 被 判 为 应 该 保留 的 像 元 作 上 标 
记 “2”。 等 整 幅 栅 格 数 据 中 所 有 的 边缘 都 被 跟踪 过 一 遍 ( 即 水 平 扫描 全 图 ,再 也 找 
不 到 从 “0” 到 “1" 或 从 “1" 到 “0" 的 突变 ) 后 ,将 全 图 栅 格 灰 度 值 作 一 个 统一 处 理 : 凡 
是 灰 度 值 为 "3" 的 像 元 均 置 成 “0 ,凡是 灰 度 值 为 *2" 的 像 元 均 恢 复 为 “1”"。 此 时 ,可 
谓 一 次 细 化 已 完成 。 至 于 究竟 需 不 需要 继续 进行 细 化 ,可 以 根据 在 本 次 细 化 过 程 
中 ,有 没有 “和 剥 " 掉 过 任何 像 元 而 定 , 若 计数 器 (或 标志 ) 显 示 出 本 次 细 化 中 和 曾 “ 剥 ?过 
像 元 , 则 需 继 续 进 行 下 一 次 细 化 ,否则 说 明细 化 已 完成 。 图 4.18 显示 出 了 第 一 次 
全 图 边缘 跟踪 并 作 标 记 后 的 灰 度 值 情况 。 这 种 算法 的 优点 是 只 对 边缘 像 元 进行 处 
理 ,因此 细 化 效率 高 。 


4.2.4 ”多边形 栅 格 转 矢量 的 双边 界 搜索 算法 


算法 的 基本 思想 是 通过 边界 提取 ,将 左右 多 边 形 信息 保存 在 边界 点 上 ,每 条 边 
界 绝 段 由 两 个 并 行 的 边界 链 组 成 ,分 别 记录 该 边界 弧 段 的 左右 多 边 形 编号 。 边 界 
线 搜索 采用 2x2 栅 格 窗 口 ,在 每 个 窗口 内 的 4 个 栅 格 数据 的 模式 ,可 以 唯一 地 确 
定 下 一 个 窗口 的 搜索 方向 和 该 弧 段 的 拓扑 关系 , 极 大 地 加 快 了 搜索 速度 ,拓扑 关系 
也 很 容易 建立 。 具 体 步 骤 如 下 : 

(1) 边界 点 和 结 点 提取 。 采 用 2x2 栅 格 阵列 作为 窗口 顺序 沿 行 、 列 方向 对 栅 
格 狼 像 全 图 扫描 ,如 果 窗 口内 4 个 椰 格 有 且 仅 有 两 个 不 同 的 编号 , 则 该 4 个 栅 格 表 
示 为 边界 点 ;如 果 窗 口内 4 个 棚 格 有 3 个 以 上 不 同 编 号 , 则 标识 为 结 点 ( 即 不 同 边 
界 弧 段 的 交汇 点 ) ,保持 各 栅 格 原 多 边 形 编号 信息 。 对 于 对 角 线 上 栅 格 两 两 相同 的 
情况 ,由 于 造成 了 多 边 形 的 不 连通 ,也 当 作 结 点 处 理 。 图 4.19 和 图 4.20 给 出 了 节 
点 和 边界 点 的 各 种 情形 。 

(2) 边界 线 搜索 与 左右 多 边 形 信息 记录 。 边 界线 搜索 是 逐个 弧 段 进行 的 ,对 
每 个 弧 段 由 一 组 已 标识 的 4 个 结 点 开始 , 选 定 与 之 相 邻 的 任意 一 组 4 个 边界 点 和 
结 点 者 必定 属于 某 一 窗口 的 4 个 标识 点 之 一 。 首 先 记录 开始 边界 点 的 两 个 多 边 形 
编号 ,作为 该 弧 段 的 左右 多 边 形 , 下 一 点 组 的 搜索 方向 则 由 进入 当前 点 的 搜索 方向 
和 该 点 组 的 可 能 走向 决定 ,每 个 边界 点 组 只 能 有 两 个 走向 ,一 个 是 前 点 组 进入 的 方 
向 , 另 一 个 则 可 确定 为 将 要 搜索 后 续 点 组 的 方向 。 例 如 ,图 4.20(c) 所 示 边 界 点 组 


第 4 章 空间 数据 转换 算法 “ 85 


(a) (b) (0) (d) 


(©) (D 人 (h) 





图 4.19 节点 的 8 种 情形 


只 可 能 有 两 个 方向 , 即 下 方 和 右 方 ,如 果 该 边界 
上 和 由 坟 的 一 上 组 过- 则 并 后 
组 一 定 在 其 右 方 ;反之 ,如 果 该 点 在 其 右 方 的 点 | | | | | | 


组 之 后 被 搜索 到 ( 即 该 弧 段 的 左右 多 边 形 编号 。 四 中 © 


分 别 为 b 和 a) ,对 其 后 续 点 组 的 搜索 应 确定 为 - 

下 方 ,其 他 情况 依 此 类 推 。 可由 时 可 | 上 二- -一 

以 唯一 地 确定 搜索 方向 , 从 而 大 大 地 减少 搜索 | "| | [| | Ll 
(e) (有 


时 间 , 同 时 形成 的 矢量 结构 带 有 左右 多 边 形 编 ” (4) 
号 信息 ,容易 建立 拓扑 结构 和 与 属性 数据 的 联 
系 , 提 高 转换 的 效率 。 
(3) 多 余 点 去 除 。 多 余 点 的 去 除 基本 思想 是 在 一 个 边界 弧 段 上 连续 的 3 个 
点 ,如 果 在 一 定 程度 上 可 以 认为 在 一 条 直线 上 (满足 直线 方程 ), 则 3 个 点 中 间 一 点 
可 以 被 认为 是 多 余 的 ,予以 去 除 。 即 满足 : 
Z1 二 Y2_ XI XT 7Z3 X27X3 
VET V2 NEY NY, “2 .03 
由 于 在 算法 上 的 实现 ,要 尽 可 能 避免 出 现 除 零 情 形 , 可 以 转化 为 以 下 形式 : 
(xX1— X2) (yy3)= (x1 x3)(y1— y2) 





图 4.20 边界 点 的 6 种 情形 





或 
(X11 XI3)(y2— y3)= (x2— XI3)(y1 ~ y3) 
式 中 ,(zi,yi),(zzyz),(z3,y3) 为 某 精 度 下 边界 弧 段 上 连续 3 点 的 坐标 , 则 (zz;， 
2) 为 多 余 点 ,可 予以 去 除 。 
多 余 点 是 由 于 栅 格 向 矢量 转换 时 逐 点 搜索 边界 造成 的 ( 当 边 界 为 或 近似 为 一 
直线 时 ) ,这 一 算法 可 大 量 去 除 多 余 点 ,减少 数据 元 余 。 
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4.2.5 ”多边形 栅 格 转 矢量 的 单 边界 搜索 算法 


单 边界 搜索 算法 是 通过 对 传统 的 区 域 跟踪 算法 进行 改进 而 形成 的 。 在 传统 的 
区 域 跟踪 算法 中 ,对 区 域 的 描述 由 两 部 分 组 成 :区 域外 轮廓 和 内 部 孔洞 。 因 此 运用 
传统 的 区 域 跟 踪 算法 完整 地 跟踪 一 个 区 域 有 如 下 3 个 步骤 :中 确定 区 域外 轮廓 跟 
踪 的 起 始点 ;@@ 对 区 域 的 外 轮廓 进行 跟踪 和 记录 ;对 区 域内 部 的 所 有 孔洞 进行 扫 
措 跟 踪 和 记录 。 

单 边界 搜索 算法 发 展 了 上 述 思 路 , 它 可 以 搜索 并 跟踪 出 一 幅 图 像 中 的 所 有 区 
域 并 生成 区 域 间 的 主要 空间 拓扑 关系 ,如 包含 . 相 邻 等 。 由 于 算法 执行 的 结果 中 包 
含 了 区 域 间 的 包含 关系 ,因此 对 一 个 区 域 的 描述 可 以 进一步 简化 。 

可 以 将 图 像 中 的 所 有 区 域 按 包 含 关系 分 为 若干 层 。 定 义 最 外 层 区 域 为 第 一 
层 , 次 外 层 区 域 为 第 二 层 , 依 此 类 推 。 一 幅 图 像 内 区 域 的 最 高 层 数 由 图 像 内 容 决 
定 ,每 一 层 至 少 包含 有 一 个 区 域 对 象 。 这 样 , 单 边界 搜索 算法 的 流程 可 描述 如 下 : 
搜索 跟踪 第 一 层 所 有 的 区 域 并 记录 外 轮廓 和 内 部 孔 润 信息;@ 根 据 跟 踪 到 的 孔 
洞 信 息 找 出 下 一 层 中 未 跟踪 过 的 区 域 的 外 轮廓 跟踪 起 始点 ( 即 找 出 一 个 新 区 域 ); 
电 跟 踪 找 到 的 新 区 域 并 记录 其 外 轮廓 和 内 部 孔洞 信息 ;@@ 重 复 @ 一 加 步 ,直到 该 层 
所 有 区 域 都 已 被 跟踪 完毕 ;@@ 重 复 思 一 由 步 , 直 到 整 幅 图 像 内 所 有 区 域 都 已 被 跟踪 


2 
完毕 。 


下 面 详细 讨论 该 算法 的 实现 和 空间 拓扑 关系 的 生成 。 
1. 目标 对 象 间 的 拓扑 关系 


为 了 实现 数据 的 检索 .查询 .控制 与 处 理 ,矢量 数据 中 必须 包含 目标 对 象 间 空 
间 拓 扑 关系 的 直接 表示 。3 种 典型 的 空间 拓扑 信息 如 图 4.21 所 示 。 


对 象 
对 象 1 对 象 ? 
对 象 2 


对 象 ! 对 象 2 
(a) 相 邻 信息 (b) 包含 信息 (G) 节点 信息 
图 4.21 3 种 典型 的 空间 拓扑 信息 示意 图 


节点 是 两 个 以 上 相 邻 目标 对 象 的 交汇 处 。 图 4.19 列举 了 图 像 上 节点 对 应 的 
8 种 结构 。 
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2. 矢量 数据 结构 编码 


矢量 数据 对 象 主要 包括 点 、 线 .区 域 3 种 实体 。 下 面 定义 了 一 种 简单 明了 的 矢 
量 数据 结构 ,如 图 4.22 所 示 。 
区 域 


编号 

属性 什 

相 邻 区 域 编号 

父 区 域 编号 

起 始点 编号 

外 轮廓 坐标 序列 〈 链 码 序列 ) 
图 4.22 矢量 数据 结构 编码 

3. 单个 区 域 跟 踪 算 法 


单个 区 域 跟 踪 由 两 部 分 组 成 :确定 外 轮廓 跟踪 起 始点 并 进行 外 轮 廊 跟踪 ,内 部 
孔洞 扫描 与 跟踪 ,如 图 4.23 所 示 。 


外 轮 麻 眼 

踪 起 始点 八 、o 
内 部 孔洞 跟 
踪 起 始点 





O° 
O 〇 
© 
oO 
oO 
O 〇 
O00000000nDo 


图 4.23 单个 区 域 轮廓 跟踪 


1) 确定 外 轮廓 跟踪 起 始点 并 进行 外 轮廓 跟踪 

外 轮廓 像素 可 以 用 一 个 通路 来 遍历 ,并 且 总 可 以 为 这 一 遍历 选择 一 条 封 闵 的 
通路 。 为 讨论 问题 简便 起 见 ,将 假定 一 种 特定 的 遍历 形式 。 该 遍历 形式 可 利用 一 
个 观察 者 来 说 明 。 观 察 者 沿 着 属于 该 集合 的 像素 走 ,并 选择 最 右边 的 像素 作为 所 
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得 像素 ,将 所 得 像素 做 标记 值 al ,同时 将 检测 到 的 点 的 对 应 链 码 值 存 人 矢量 文件 。 
该 遍历 要 求 起 始点 在 外 轮廓 的 向 下 弧 段 上 。 遍 历 过 程 遇 到 已 标记 为 ai 的 起 始点 
则 意味 着 跟踪 的 结束 。 为 了 获取 目标 对 象 (轮廓 ) 的 节点 信息 ,本 书 在 遍历 的 同时 
检测 外 轮廓 像素 点 与 相 邻 像素 点 之 间 的 结构 特性 。 设 当前 外 轮廓 像素 点 为 P, 则 
为 提取 节点 信息 需要 检测 的 4 个 窗口 如 图 4.24 所 示 。 


,mh 
地 国 型 现 


(a) (b) (c) (d) 
图 4.24 节点 信息 检索 窗口 


一 且 发 现 与 节点 结构 [图 4.24(b)] 相 同 的 像素 窗口 ,就 意味 着 发 现 了 新 的 节 
点 。 将 节点 信息 记录 到 矢量 文件 中 去 ,并 同时 将 节点 处 4 个 像素 做 标记 , 以 后 不 再 
对 其 进行 节点 检测 。 1 


2) 内 部 孔洞 扫描 与 跟踪 


内 部 孔洞 跟踪 的 起 始点 也 要 位 于 孔洞 轮廓 的 向 下 弧 段 上 。 设 区 域外 轮廓 跟踪 
的 结果 ( 链 码 序列 ) 都 依次 放 人 一 个 队列 Q 中 。 为 找 出 内 部 孔洞 的 位 置 , 需 结合 使 
用 一 个 搜索 算法 。 搜 索 算 法 首先 对 Q 中 的 内 容 进行 检测 ,如 果 找 到 一 个 位 于 向 下 
弧 段 上 的 点 ,就 开始 向 右 搜 索 , 直 至 搜索 到 孔洞 的 起 始点 或 外 轮廓 的 另 一 边 为 止 。 
孔洞 跟踪 过 程 除 跟 踪 方 向 与 外 轮廓 跟踪 相反 外 其 余 操 作 相 同 。 将 孔洞 信息 放 人 一 
个 临时 存储 区 S 中 ,以 起 始 下 一 层 的 区 域外 轮廓 跟踪 过 程 。 当 下 一 层 区 域 的 外 轮 
廓 跟踪 过 程 结 束 后 ,S 中 的 内 容 将 被 新 一 层 的 区 域 孔 洞 信息 所 取代 。 


4. 整 幅 图 像 内 所 有 区 域 的 跟踪 算法 


在 前 述 单个 轮廓 跟踪 算法 的 基础 上 ,全 部 区 域 的 跟踪 问题 也 就 归结 为 下 一 个 
要 跟踪 区 域外 轮廓 的 起 始点 确定 问题 。 起 始点 的 确定 可 分 为 两 种 情况 。 当 需要 跟 
踪 的 区 域 属 于 第 一 层 时 , 则 通过 对 已 跟踪 过 的 区 域外 轮廓 链 码 序列 进行 检测 来 寻 
找 该 外 轮廓 的 向 上 弧 段 。 对 紧 靠 该 向 上 弧 段 右 侧 的 点 进行 检测 , 若 发 现 了 一 个 未 
标记 为 轮廓 点 的 像素 点 (其 值 不 等 于 a1), 则 该 点 就 是 所 需要 的 下 一 区 域外 轮廓 跟 
踪 的 起 始点 。 当 需 跟踪 的 区 域 为 第 二 层 或 更 高 层 时 , 可 以 通过 上 一 层 区 域 的 孔洞 
信息 来 确定 新 区 域外 轮廓 跟踪 的 起 始点 。 检 测 S 中 的 孔洞 链 码 序列 , 若 发 现 了 向 
上 弧 段 ,就 开始 检查 紧 靠 该 弧 段 右 侧 的 点 , 若 该 点 未 被 标记 为 轮廓 点 (其 值 不 等 于 
al) , 则 该 点 就 起 始 了 一 个 新 的 区 域外 轮廓 的 跟踪 。 整 幅 图 像 第 一 个 区 域外 轮 廊 的 
跟踪 起 始点 可 固定 为 (0,0) 点 。 当 检测 不 到 符合 要 求 的 区 域外 轮廓 跟踪 起 始点 时 ， 
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整 幅 图 像 的 区 域 跟 踪 过 程 也 就 结束 了 。 
5. 区 域 间 拓 扑 关 系 的 确立 


上 述 算法 只 考虑 建立 区 域 对 象 间 的 相 邻 和 包含 两 种 关系 。 由 于 内 层 区 域外 轮 
廊 起 始点 是 由 外 层 区 域 跟 踪 所 得 到 的 孔洞 信息 所 确定 的 ,所 以 内 层 区 域 自动 获得 
了 和 孔洞 所 在 区 域 也 就 是 父 区 域 的 信息 ,从 而 实现 了 区 域 对 象 之 间 包 含 关系 的 自动 
确立 。 

外 轮廓 跟踪 过 程 中 记录 的 节点 信息 中 包含 了 区 域 的 相 邻 信息 。 节 点 是 3 个 或 
4 个 区 域 的 交汇 处 ,这 种 交汇 表示 了 区 域 间 的 相 邻 关系 。 某 一 特定 区 域 可 以 通过 
一 个 对 节点 信息 的 简单 搜索 得 到 所 有 与 之 相 邻 的 区 域 。 


思 考题 


1. 编写 边界 代数 算法 程序 实现 面 状 矢量 空间 数据 向 袜 格 空间 数据 的 转换 。 
2. 编写 多 边 形 栅 格 转 矢量 的 双边 界 搜索 算法 程序 实现 面 状 栅 格 空间 数据 向 
矢量 空间 数据 的 转换 。 


2 t Dy 
第 5 革 空间 数据 组 织 算法 
5.1 矢量 数据 的 压缩 
矢量 数据 的 压缩 包括 两 个 方面 的 内 容 : 一 是 在 不 扰乱 拓扑 关系 的 前 提 下 ,对 采 
样 点 数据 进行 合理 的 抽 稀 ;二 是 对 矢量 坐标 数据 重新 进行 编码 ,以 减少 所 需要 的 存 
储 空间 。 矢 量 数据 的 压缩 往往 是 不 可 道 的 ,数据 压缩 后 ,数据 量变 小 了 ,数据 的 精 
度 降低 了 。 
5.1.1 间隔 取 点 法 
每 隔 K 个 点 取 一 点 ,或 会 去 那些 离 已 选 点 比 规定 距离 更 近 的 点 ,但 首 、 玉 点 一 


定 要 保留 ,如 图 5.1 所 示 。 这 种 方法 可 大 量 压 缩 数 字 化 仪 用 连续 方法 获取 的 点 列 
中 的 点 .曲率 显著 变化 的 点 ,但 不 一 定 能 恰当 地 保留 方向 上 曲率 显著 变化 的 点 。 


(a) (a) . (b) (b) 


图 5.1 由 (a) 舍 去 每 两 点 中 一 点 得 (a ) 和 由 (b) 的 仅 保留 与 
已 选 点 距离 超过 临界 值 的 点 得 (b ) 


S.1.2 垂 距 法 和 偏 角 法 


这 两 种 方法 是 按 垂 距 或 偏 角 的 限 差 , 选 取 符合 或 超过 限 差 的 点 ,其 过 程 如 
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图 5.2 所 示 。 这 两 种 算法 虽然 不 能 同时 考虑 相 邻 点 间 的 方向 与 距离 , 且 有 可 能 合 
去 不 该 舍 去 的 点 ,但 较 前 一 种 方法 有 进步 。 


4 ”原来 的 线 
1 
bd 有 


对 点 2 测试 角度 
大 于 规定 的 限 差 


~ 原来 的 线 
1 


一- 对 点 2 测试 距离 
大 于 规定 的 限 差 


对 点 3 测试 偏 角 
小 于 规定 限 差 


对 点 3 测试 距离 
小 于 规定 限 差 


3 点 舍 去 


3 点 会 去 4 
化 简 后 的 线 


化 简 后 的 线 


LJ 限 差 





垂 距 算法 


图 5.2 按 垂 距 和 偏 角 限 差 取 点 的 过 程 


5.1.3 道格拉斯 - 普 克 法 


首先 ,将 一 条 曲线 首 、 末 点 连 一 条 直线 , 求 出 其 余 各 点 到 该 直线 的 距离 , 选 其 最 
大 者 与 规定 的 临界 值 相 比 较 , 若 大 于 临界 值 , 则 离 该 直线 距离 最 大 的 点 保留 ,否则 
将 直线 两 端 间 各 点 全 部 舍 去 , 即 道格拉斯 - 普 克 (Douglas-Peucker) 法 。 如 图 5.3 所 
示 , 经 数据 采样 得 到 的 曲线 MN 由 点 序 {Pi,P2,P3,… ,P| 组 成 ,n 个 点 的 坐标 集 
为 {(zi,y1),(zayy), (za y3)， (Za; Yn)|。 其 中 ,Pi1、P 分 别 对 应 曲线 的 起 
点 M 和 终点 N。 
现 根据 应 用 需要 和 数据 精度 要 求 ,给 定 控 制 数据 压缩 的 极 差 为 s,s 表示 为 被 
舍弃 的 点 偏离 特征 点 连 线 之 间 的 垂直 距离 。 曲 线 的 空间 数据 压缩 过 程 如 下 。 
第 一 步 :确定 曲 线 MN 对 应 弦 的 直线 方程 。 
根据 两 点 式 直 线 方程 ,由 起 点 M 终点 N 建立 直线 IMN 方程 为 
TM _ MM >N 
ZX—XM TM- ZN 
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图 5.3 道格拉斯 - 普 克 法 
将 上 式 化 简 为 一 般 形式 为 


Ar+By+C=0 
式 中 ， 





YM YN 
V (Vu YN) + (zm ~ xn) 
加 ZN TM 
V (YM — YN) + (zu - xn) 
MYN TNYM 
V (yA YN) + (zm zxN)’ 
第 二 步 : 求 曲线 MN 上 各 点 P; 到 弦 线 MN 的 距离 心 。 
根据 点 到 直线 的 距离 计算 公式 , P;(zi,y) 到 弦 线 MN 的 距离 为 
di= |Az;+ By:+C| 


第 三 步 : 求 距离 d; 的 最 大 值 di 。 
dp =max(d1,d;,d3,.", dn) 


第 四 步 :比较 di; 与 s 的 大 小 ,并 计算 开关 Q。 


Q- 习 和 >e 
0…d <e 


第 五 步 :决定 取舍 ,提取 中 间 特 征 点 。 
(1) 如 果 Q =0, 则 直接 可 以 用 弦 线 MN (M NN 为 特征 点 ) 代 替 曲 线 MN ; 转 
第 六 + O 
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(2) 如 果 Q=1, 则 将 gd 所 对 应 的 点 了 P;( zz; ,y;) 抽 出 ,暂时 作为 中 间 特 征 点 ; 然 
后 连接 新 缠 线 MP;; 转 第 一 步 ( 以 MP, 已 代替 MN ,继续 计算 和 判断 )。 

若 Q=0, 则 可 以 用 弦 线 MP; 代替 曲线 MPi ;将 P; 作为 中 间 特 征 点 取出 ;顺序 
排 在 M 点 之 后 ,成 为 继 M 之 后 的 第 一 个 中 间 特 征 点 ;并 连接 PN , 转 第 一 步 (以 
PN 代替 MN ,继续 计算 和 判断 )…… 

若 Q=1, 则 不 可 以 用 弦 线 MP; 代替 曲线 MP;; 找 到 此 时 dj 所 对 应 的 点 Pi， 
并 连接 新 强 线 MP, ; 转 第 一 步 ( 以 MP, 代替 MN ,继续 计算 和 判断 )…… 

六 步 :形成 新 的 数据 文件 。 

将 所 有 提取 出 的 中 间 特 征 点 从 起 点 M 开始 ,顺序 排列 至 终点 N ,并 写 入 新 的 
数据 文件 , 即 得 到 化 简 后 的 折线 的 数据 文件 。 

如 图 5.3 所 示 , 曲 线 MN 的 特征 点 提取 过 程 如 下 : 

(1) 找到 曲线 MN 上 4 对 应 点 位 为 1 号 点 ;经 判断 可 以 用 弦 线 Mi 代替 曲线 
Mi, 故 1 号 点 是 继 M 点 之 后 提取 出 的 第 一 个 特征 点 ; 

(2) 连接 弦 线 LN; 经 判断 ,不 可 以 用 弦 线 1N 代替 曲线 1N ;找到 曲线 IN 上 
之 di 的 对 应 点 位 为 2 号 点 ; 故 连 接 1.2 号 点 之 弦 线 12; 经 判断 ,还 是 不 可 以 用 弦 线 
12 代替 曲线 12; 找 到 曲线 12 上 之 a 的 对 应 点 位 为 3 号 点 ;再 连接 1、3 号 点 之 弦 
线 13; 经 判断 ,可 以 用 弱 线 13 代替 曲线 13; 故 3 号 点 是 继 1 号 点 之 后 提取 出 的 第 
二 个 特征 点 ; 

(3) 连接 弱 线 3N; 经 判断 ,不 可 以 用 弦 线 3N 代替 曲线 3N; 找 到 曲线 3N 上 
之 d; 的 对 应 点 位 仍 为 2 号 点 ;然后 ,连接 3、2 号 点 之 弦 线 32; 经 判断 ,可 以 用 弦 线 
32 代替 曲线 32; 故 2 号 点 是 继 1 号 点 ,3 号 点 之 后 提取 出 的 第 三 个 特征 点 ; 

(4) 连接 2、N 号 点 之 弦 线 2N; 经 判断 ,可 以 用 弦 线 2N 代替 曲线 2N ;中 间 
特征 点 提取 结束 。 

至 此 可 知 ,曲线 MN 可 以 用 特征 点 M、1、3、2、N 顺序 连接 的 折线 简化 表示 。 


5.1.4 光 栏 法 


它 按 预 先 定义 的 一 个 扇形 (“喇叭 口 ”) ,根据 曲线 上 各 节点 是 在 扇形 外 还 是 在 
肩 形 内 ,决定 节点 是 保留 还 是 合 去 。 

设 有 曲线 点 列 |p;| ,i=1,2,…,n,“ 光 栏 口径 ”为 d( 由 用 户 自己 定义 ), 则 该 
方法 实施 的 具体 步骤 (图 5.4) 是 : 

(1) 连接 pi 和 思 ,过 p, 点 作 一 条 垂直 于 p1p; 的 直线 ,在 该 垂 线 上 取 两 点 al 


和 42, 使 a1pz= a2p2= 与 ,此 时 41 和 a2 为 “ 光 栏 "边界 点 , pi 与 a1.pi 与 中 的 
连 线 为 以 pi 为 顶点 的 扇形 的 两 条 边 ,这 就 定义 了 一 个 扇形 (这 个 扇形 的 口 朝向 曲 
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图 5.4 光 栏 法 原理 
线 的 前 进 方向 , 边 长 是 任意 的 )。 通 过 pi 并 在 扇形 内 的 所 有 直线 都 具有 这 种 性 质 ， 


即 pip2 上 各 点 到 这 些 直线 的 重 距 都 不 大 于 和 。 
(2) 若 ps 点 在 扇形 内 , 则 舍 丢 点 。4 1 Pi 和 ps, 过 p3 作 pip 的 垂 





输入 光 栏 的 口径 4 


piw 在 由 al、pi、 二 | 


Pa 所 已 以 p、PhrI 为 轴 
人 ep 外 接 4 计 站 光芒 边界 


bi 02 


大计 1 
Pd 在 p 
按 q 建 光 栏 ， 计 算 光 
ee 4 的 坐标 


Pa 在 由 ap 人 
的 扇形 内 


直至 终点 (压缩 后 的 总 点 数 为 洲 1) 





图 5.5 光 栏 法 曲线 数据 压缩 程序 流程 图 
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线 ,该 垂 线 与 前 面 定 义 的 扇形 边 交 于 c; 和 c?。 在 垂 线 上 找到 6 和 6 点 ,使 p361 
=psb2= 儿 .车 bi 和 bs 点 落 在 原 扇形 外 面 (图 5.4 中 为 六 点 ), 则 用 ci 或 < 取 
代 ( 图 5.4 中 由 性 取代 65,)。 此 时 用 pi51 和 picz 定义 一 个 新 的 扇形 ,这 当然 是 
口径 (pic>) 缩 小 了 的 “ 光 栏 "。 

(3) 检查 下 一 节点 ,车 该 点 在 新 房 形 内 , 则 重复 第 (2) 步 ;直到 发 现 有 一 个 节点 
在 最 新 定义 的 扇形 外 为 止 。 : 

(4) 当 发 现在 扇形 外 的 节点 ,如 图 5.4 中 的 pa, 此 时 保留 点 p3, 以 p3 作为 新 
起 点 ,重复 (1) 一 (2) 步 。 

如 此 继续 下 去 ,直到 整个 点 列 检测 完 为 止 。 所 有 被 保留 的 点 ( 含 首 、. 未 点 ), 顺 
序 地 构成 了 简化 后 的 新 点 列 。 其 流程 图 如 图 5.5 所 示 。 


5.1.5 曲线 压缩 算法 的 比较 
为 了 说 明 哪 种 简化 方法 能 提供 最 精确 的 表示 和 最 大 限度 地 淘汰 不 必要 数据 
点 ,可 按压 缩 后 的 总 长 度 、 原 曲线 及 压缩 后 曲线 的 线性 位 移 ( 矢 高 和 面积 ) 以 及 其 他 


几何 量 测 来 评价 。 根 据 线性 位 移 量 来 分 析 仿 角 法 .间隔 取 点 法 、 垂 距 法 和 道 格 拉 
斯 - 普 克 方 法 ,结果 如 图 5.6 所 示 : 道 格拉 斯 - 普 克 法 具有 最 小 的 线性 位 移 ; 偏 角 法 


9 总 的 矢 高 指标 


指标 值 





图 5.6 总 的 矢 高 和 面积 指标 值 
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图 5.6( 续 ) 


在 所 有 的 压缩 水 平 上 较 其 他 3 种 方法 具有 更 大 的 线性 位 移 量 ,但 仅 根 据 矢 高 位 移 
量 又 很 难 对 间隔 取 点 法 的 算法 做 出 结论 , 而 在 舍 去 30% 一 70% 的 点 时 ,无论 按 矢 
高 位 移 量 还 是 按 面积 位 移 量 来 评价 , 垂 距 法 显然 较 偏 角 法 和 间隔 取 点 法 好 。 总 的 
结论 是 ,淘汰 的 点 数 越 多 ,它们 的 压缩 效果 越 趋 于 一 致 。 总 之 ,在 一 般 情 况 下 ， 
图 5.6 所 列 4 种 方法 中 ,道格拉斯 - 普 克 方法 压缩 效果 占 优 ,其 次 是 垂 距 法 .间隔 取 
点 法 和 偏 角 法 ,但 道格拉斯 - 普 克 方法 需 对 整 条 曲线 完成 数字 化 后 方 能 进行 压缩 ， 
且 计算 工作 量 较 大 。 光 栏 法 则 不 仅 算法 严密 ,能 按 给 定 阔 值 保 留 曲 线 特征 点 ,并 能 
实时 处 理 ,运算 量 少 ,占用 内 存 少 。 


5.1.6 面 域 的 数据 压缩 算法 
面 域 空间 数据 的 压缩 过 程 可 以 看 成 是 组 成 其 边界 的 曲线 段 的 分 别 压缩 ,每 段 
边界 曲线 的 压缩 过 程 如 前 所 述 。 但 有 两 个 问题 需要 注意 。 
1. 封闭 曲线 的 数据 压缩 


面 域 由 首尾 相连 的 封闭 曲线 组 成 。 此 时 ,可 以 人 为 地 将 该 封闭 线 分 割 为 首尾 
相连 的 两 段 曲 线 , 然 后 就 可 以 按 前 述 方法 进行 压缩 。 曲 线 分 割 的 原则 是 : 
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(1) 原 节 点 是 分 割 点 之 一 ; 

(2) 离 原 节点 最 远 的 下 一 节点 是 分 割 点 之 二 。 

如 图 5.7 所 示 ,多 边 形 P 的 边界 曲线 由 从 节点 A 出 发 的 曲线 封闭 而 成 ;其 中 
曲线 上 B 点 离 节 点 A 最 远 。 因 而 ,多 边 形 P 的 边界 曲线 可 以 分 割 为 AMB 和 
BNA 两 段 ,进而 对 曲线 段 AMB 、BNA 分 别 进行 压缩 。 





图 5.7 封闭 曲线 的 数据 压缩 及 其 结果 
据 上 述 原 则 ,以 圆 曲线 为 例 进行 数据 压缩 。 图 5.8 所 示 为 采用 不 同 。 后 的 压 


缩 结果 。 


QOO 


图 5.8 不 同 s 下 圆 曲线 的 压缩 结果 
2. 公共 节点 的 取舍 问题 


在 某 些 特定 情况 下 , 面 域 的 边界 曲线 由 多 段 首尾 相连 的 曲线 连接 而 成 ,其 压缩 
可 以 分 段 进行 。 此 时 各 段 曲 线 的 起 点 和 终点 必然 作为 特征 点 提取 出 来 ,因而 可 能 
产生 数据 元 余 。 比 如 ,当前 后 曲线 段 过渡 时 很 平缓 ,曲线 段 的 公共 节点 可 以 不 成 为 
特征 点 , 即 该 点 前 后 的 两 段 曲 线 可 以 直接 用 该 点 前 后 的 两 个 特征 点 的 连 线 来 代替 。 
如 图 5.9 所 示 ,1、2 号 点 分 别 是 面 域 P 的 边界 曲线 AB、BC 段 的 内 部 特征 提取 点 ， 
因而 可 以 用 弦 1B、B2 分 别 代替 曲线 1B 和 B2。 而 实际 上 ,整个 曲线 1B2 仍 可 以 
用 弦 12 来 代替 。 

因此 ,在 处 理 面 域 空间 数据 压缩 时 ,可 以 在 边界 曲线 分 段 压 缩 的 基础 上 ,增加 
一 个 步骤 , 即 对 边界 曲线 的 端点 进行 可 删 性 检验 :如 果 前 一 曲线 最 后 提取 的 中 间 特 
征 点 与 后 一 曲线 最 先 提取 的 中 间 特 征 点 之 间 的 曲线 满足 极 差 控制 条 件 , 则 两 条 曲 
线 的 连接 节点 可 以 删 减 ;否则 ,不 可 删 减 。 
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图 5.9 ”曲线 段 公共 节点 的 取舍 


由 于 各 段 边界 曲线 的 数据 文件 要 重新 生成 ,所 以 当 两 段 曲线 的 公共 节点 删 减 
之 后 ,相当 于 两 条 曲线 合并 为 一 条 曲线 。 此 时 可 能 会 扰乱 拓扑 关系 (如 曲线 AB 或 
BC 为 多 边 形 的 公共 边 ,或 AB 和 BC 均 为 多 边 形 的 公共 边 ) ,因此 在 处 理 公共 节点 
的 取舍 时 要 慎重 ,应 该 对 此 加 以 限制 。 


5.2 栅 格 数据 的 压缩 


栅 格 数据 文件 记录 有 3 个 基本 方式 :基于 像 元 、 基 于 层 和 基于 面 域 。 这 3 种 方 
式 都 离 不 开 对 像 元 坐标 和 属性 的 记录 。 因 此 基于 顶 格 的 空间 数据 压缩 的 实质 是 研 
究 栅 格 数 据 的 编码 ,通过 编码 尽量 减少 像 元 数量 的 存储 。 栅 格 数据 的 压缩 分 为 无 
损 压 缩 技术 和 有 损 压 缩 技术 。 无 损 压 缩 方 法 利用 数据 的 统计 宛 余 进行 压缩 , 可 完 
全 恢复 原始 数据 而 不 引入 任何 失真 ,但 压缩 率 受到 数据 统计 宛 余 度 的 理论 限制 ,一 
般 为 2:1 一 5:1。 有 损 压 缩 方法 利用 了 数据 在 使 用 中 存在 某 些 成 分 不 敏感 的 特性 ， 
人 允许 压缩 过 程 中 损失 一 定 的 信息 ;虽然 不 能 完全 恢复 原始 数据 ,但 是 所 损失 的 部 分 
对 数据 内 涵 的 影响 较 小 , 却 换 来 了 大 得 多 的 压缩 比 。 栅 格 数据 的 压缩 方法 非常 丰 
富 ,这 里 仅 从 数据 组 织 的 角度 介绍 几 种 常见 的 栅 格 数据 的 无 损 压 缩 算 法 ,有 关 这 方 
面 的 其 他 内 容 可 参照 遥感 数字 图 像 处 理 方面 的 相关 内 容 。 


5.2.1 链 式 编码 


链 式 编码 又 称 为 弗 里 曼 链 码 (Freeman,1961 年 ) 或 边界 链 码 。 如 图 5.10 所 
示 , 其 中 的 多 边 形 边 界 可 表示 为 :由 某 一 原点 开始 并 按 某 些 基 本 方向 确定 的 单位 矢 
量 链 。 基 本 方向 可 定义 为 : 东 =0, 东 南 =1, 南 =2, 西 南 =3, 西 =4, 西 北 =5, 北 = 
6, 东 北 =7,8 个 基本 方向 。 

如 果 再 确定 原点 为 像 元 (10,1), 则 该 多 边 形 边界 按 顺 时 针 方 向 的 链 式 编码 
(图 5.11) 为 :10,1,7,0,1,0,7,1,7,0,0,2,3,2,2,1,0,7,0,0,0,0,2,4,3,4,4,3， 
4,4,5,4,5,4,5,4,5,4,6,6。 


第 5 章 空间 数据 组 织 算法 。 99. 





EN /7 


ES/1 





3,1,7,0,1,2,3,4,5,6 4,1,6,7,0,1,2,3,4,5 


图 5.10 链 式 编码 表示 栅 格 和 矩阵 数据 











图 5.11 栅 格 地 图 上 的 一 个 简单 区 域 


链 式 编码 的 特点 : 链 式 编码 对 多 边 形 的 表示 具有 很 强 的 数据 压缩 能 力 , 且 具有 
一 定 的 运算 功能 ,如 面积 和 周 长 计 算 等 ,探测 边界 急 弯 向 进 部 分 等 都 比较 容易 ; 
另外 缺点 是 对 释 置 运算 如 组 合 、 相 交 等 则 很 难 实施 ,对 局 部 修改 将 改变 整体 结构 ， 
效率 较 低 , 而 且 由 于 链 码 以 每 个 区 域 为 单位 存储 边界 , 相 邻 区 域 的 边界 则 被 重复 存 
储 而 产生 元 余 。 


5.2.2 游程 长 度 编码 


游程 指 相 邻 同 值 网 格 的 数量 ,游程 长 度 编码 结构 是 逐 行将 相 邻 同 值 的 网 格 合 
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并 ,并 记录 合并 后 网 格 的 值 及 合并 网 格 的 长 度 , 其 目的 是 压缩 概 格 数据 量 ,消除 数 
据 间 的 元 余 。 i 

游程 长 度 编 码 结构 的 建立 方法 是 :将 栅 格 矩 阵 的 数据 序列 XI , XX,…,X;, 映 
射 为 相应 的 二 元 组 序列 (A;,P;),i=1,2,…,K, 且 KK 过 x。 其 中 ,A 为 属性 值 ,P 
为 游程 ,K 为 游程 序号 。 

例如 ,将 图 5.12 的 栅 格 矩阵 结构 转换 为 游程 编码 结构 ,如 图 5.13 所 示 。 


太 
[a17 TsTs 

S 一 
[sTsTsls 


图 5.12 面 域 栅 格 矩阵 结构 








图 5.13 游程 长 度 编码 表示 栅 格 矩阵 数据 
这 种 数据 结构 特别 适用 于 二 值 图 像 数 据 的 表示 ,如 图 5.14 所 示 。 
| 序号 | 二 元 组 序列 | 
| ) 





图 5.14 游程 编码 表示 二 值 图 像 数据 


游程 编码 能 否 压 缩 数 据 量 , 主要 决定 于 栅 格 数据 的 性 质 ,通常 可 通过 事先 测 
试 ,估算 图 层 的 数据 元 余 度 R。: 
Q 


R。=1- 一 
mn 


式 中 , Q 为 图 层 内 相 邻 属性 值 变 化 次 数 的 累加 和 ; mz 为 图 层 网 格 的 行 数 ; ” 为 图 
层 网 格 的 列 数 。 

当 R。 的 值 大 于 17S 的 情况 下 ,表明 栅 格 数据 的 压缩 可 取得 明显 的 效果 。 其 压 
缩 效果 ,可 由 压缩 比 S= n/K 来 表征 , 即 压缩 比 的 值 愈 大 ,表示 压缩 效果 愈 显著 。 
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5.2.3 块 式 编码 


块 式 编码 是 将 游程 长 度 编码 扩大 到 二 维 的 情况 ,把 多 边 形 范围 划分 成 由 像 元 


码 。 块 式 编码 的 数据 结构 由 初始 位 置 ( 行 [TT 


号 , 列 导 ) 和 半径 ,再 加 上 记录 单元 的 代码 组 | 二 HHHHHHHHHH 


成 。 根据 这 一 编码 原则 ,图 5.15 所 示 多 边 [| TI 
形 只 需 17 个 单位 正方 形 ,9 个 4 单位 的 正方 国 量 本 全 重量 
总 开机 7 数据 上 和 272 3 EE 生生 生生 和 和 和 半 
te a ee et 
半径 。 HT 


块 式 编码 的 特点 :一 个 多 边 形 所 能 包含 [LDL 
的 正方 形 越 大 ,多 边 形 的 边界 越 简单 , 决 式 上 上 HH 二 HH 
编码 的 效果 越 好 。 游 程 和 块 式 编码 都 对 大 CLIITTITTITTTTTILL 
而 简单 的 多 边 形 更 有 效 ,而 对 那些 碎 部 较 多 
的 复杂 多 边 形 效果 并 不 好 。 块 式 编码 在 合 


并 \ 插 入 \ 检 查 延伸 性 计算 面积 等 操作 时 有 明显 的 优越 性 。 














图 5.15 块 式 编码 示意 图 


5.2.4 差分 映射 法 


由 于 属性 数据 值 在 计算 机 中 是 以 二 进 制 方式 存储 的 ,数据 越 小 ,所 占 字 节 数 越 
少 。 一 个 字 节 所 能 记录 的 二 进 制 数 为 - 127 一 127; 两 个 字 节 所 能 记录 的 二 进 制 数 
为 -32 767~32 767。 如 果 能 设法 使 研究 区 域内 的 部 分 栅 格 甚至 全 部 栅 格 的 属性 
值 减少 , 则 可 以 有 效 地 降低 栅 格 数据 文件 大 小 。 差 分 映射 法 就 是 一 种 有 效 降低 栅 
格 数据 文件 大 小 的 方法 。 

所 谓 差分 映射 法 ,就 是 选择 某 一 参照 值 对 有 关 栅 格 的 属性 值 进行 求 差 运算 , 根 
据 差 值得 到 一 个 新 的 栅 格 数据 层 。 参 照 值 的 选择 有 多 种 方式 , 即 分 行 选 取 和 全 区 
选取 。 若 分 行 选取 , 则 可 选 为 该 行 首 列 的 属性 值 , 也 可 以 选 为 该 行 的 属性 平均 值 ; 
若 全 区 选取 , 则 可 选 为 首 行 首 列 的 属性 值 , 也 可 以 选 为 全 区 的 属性 平均 值 。 

图 5.16 为 栅 格 数据 示例 。 图 5.17 所 示 为 按 分 行 选 取 方式 ,以 行 首 属性 值 为 
参照 ,对 图 5.16 作 差 分 映射 后 的 结果 。 可 以 看 出 ,经 差分 映射 处 理 后 , 除 第 一 列 
外 ,其 余 概 格 的 数据 出 现 为 零 . 位 数 降低 或 数字 减少 。 表 5.1 为 经 差分 映射 处 理 前 
后 的 各 概 格 属性 记录 所 需 字 节 数 的 对 比 ,可 见 , 所 需 字 节 数 由 原来 的 79 减少 为 
44 ,减少 44.3% 。 
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图 5.17 数据 差分 映射 结果 
表 5.1 差分 映射 前 后 栅 格 数据 记录 长 度 对 比 
第 6 列 第 7 列 






| 
。 











于 














hb mi 一 















































(| 天 | 一 | 严 | 王 | 于 








证 
Ne 


5.2.5 四 叉 树 编码 


四 叉 树 又 称 四 元 树 或 四 分 树 , 是 最 有 效 的 栅 格 数据 压缩 编码 方法 之 一 。 四 分 
树 将 整个 图 像 区 域 逐 步 分 解 为 一 系列 方形 区 域 , 且 每 一 个 方形 区 域 具有 单一 的 属 
性 。 最 小 区 域 为 一 个 像 元 。 有 关 四 叉 树 的 内 容 参 见 本 书 7.3 节 Quad-Tree 结构 。 


5.3 ”拓扑 关系 的 生成 


拓扑 空间 关系 是 一 种 对 空间 结构 进行 明确 定义 的 数学 方法 ,具有 拓扑 关系 的 
矢量 数据 结构 就 是 拓扑 数据 结构 。 矢 量 数据 拓扑 关系 在 空间 数据 的 查询 和 分 析 过 
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程 中 非常 重要 ,拓扑 数据 结构 是 地 理 信息 系统 分 析 和 应 用 功能 所 必需 的 , 它 描述 了 
基本 空间 目标 点 、 线 、 面 之 间 的 关联 、 邻 接 和 包含 关系 。 拓 扑 空 间 关 系 信息 是 空间 
分 析 、 辅 助 决策 等 的 基础 ,也 是 GIS 区 别 于 CAD( 计 算 机 辅助 设计 ) 等 的 主要 标志 。 
对 于 拓扑 关系 的 自动 建立 问题 ,研究 的 焦点 是 如 何 提 高 算法 与 过 程 的 效率 和 自动 
化 程度 ,本 节 将 讲述 其 实现 的 基本 步骤 和 要 点 。 

拓扑 关系 自动 生成 算法 的 一 般 过 程 为 : | 

(1) 弧 段 处 理 ,使 整 幅 图 形 中 的 所 有 绝 段 , 除 在 端点 处 相交 外 ,没有 其 他 交点 ， 
即 没 有 相交 或 自 相 交 的 弧 段 。 

(2) 结 点 匹配 ,建立 结 点 、 弧 段 关系 。 

(3) 建立 多 边 形 ,以 左 转 算法 或 右 转 算法 跟踪 ,生成 多 边 形 , 建 立 多 边 形 与 弧 
段 的 拓扑 关系 。 

(4) 建立 多 边 形 与 多 边 形 的 拓扑 关系 。 调 整 弧 段 的 左右 多 边 形 标识 号 。 多 边 
形 内 部 标识 号 的 自动 生成 。 

事实 上 ,拓扑 关系 的 生成 过 程 中 还 涉及 到 许多 工作 ,例如 强 段 两 端 角度 的 计 
算 、 悬 挂 结 点 和 臣 线 的 标识 多边形 面 积 计算 、 点 在 多 边 形 内 外 的 判别 等 。 


5.3.1 基本 数据 结构 
1. 拓扑 结 点 


结 点 用 来 描述 如 管线 的 交点 .道路 路 口 等 现实 世界 的 特征 对 象 , 结 点 可 以 用 来 
检测 弧 段 与 弧 段 的 连接 关系 和 多 边 形 特征 是 否 能 
正确 地 完成 。 只 与 一 条 弧 段 相连 接 的 起 点 或 终点 
叫做 翘 挂 结 点 ,如 图 5.18 所 示 的 PP 点 就 是 悬挂 
结 点 。 

结 点 一 般 包括 结 点 号 、 结 点 坐标 .与 该 结 点 连 
接 的 弧 段 集合 。 结 点 的 数据 结构 可 以 表示 为 : 





class Node 图 5.18 最 挂 结 点 
private: 
long _ ID; / 结 点 号 
Point * _ Point; /指向 结 点 坐标 的 指针 
vector< Rrc<Eoint > x* > ArcCollection ; /与 该 结 点 相连 接 的 弧 段 集合 的 指针 
public: 
Node() |...|; /构造 函数 


一 Node() {...}; V 析 构 函 数 
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other Method. . . ; /其 他 公共 操作 


| 


2. 拓扑 弧 段 及 其 表示 


拓扑 弧 段 指 处 于 两 个 结 点 之 间 的 点 序列 串 ,可 以 给 弧 段 定义 一 个 方向 ,或 者 定 
义 为 数字 化 弧 段 时 从 一 个 结 点 到 另 一 个 结 点 的 采 点 方向 ,或 者 硬性 定义 一 个 方向 。 
定义 方向 后 弧 段 开始 的 结 点 就 称 为 起 始 结 点 , 弧 段 结束 的 结 点 就 称 为 结束 结 点 ,由 
起 始 结 点 到 终止 结 点 的 方向 称 为 "起 终 方 向 ", 由 终止 结 点 到 起 始 结 点 的 方向 称 为 


“ 终 起 方向 "。 弧 段 起 终 方向 左 侧 的 多 边 形 称 为 
“《〈 基 挂 扳 县) 弧 段 的 左 多 边 形 , 弧 段 起 终 方向 右 侧 的 多 边 形 
称 为 弧 段 的 右 多 边 形 。 如 果 弧 段 的 起 始 结 点 或 
终止 结 点 只 与 一 条 强 段 相关 联 , 则 该 弧 段 称 为 
悬挂 弧 段 ,如 图 5.19 所 示 的 弧 段 工 为 悬挂 弧 


图 5.19 悬 挂 弧 段 


段 。 一 般 可 以 通过 标识 悬挂 弧 段 来 检测 原始 和 


量 数据 的 质量 。 
弧 段 一 般 包 括 骤 段 号 、 弛 段 节点 坐标 串 、 弧 段 起 始 和 终止 结 点 、 弧 段 左 右 多 边 


形 。 弧 段 的 数据 结构 可 以 表示 如 下 : 


class Arc 
| 
private: 
long _ ID; V 弧 段 号 
vector<Point > _ Points; / 弧 段 节点 坐标 串 指针 
Node x _ start; /起 始 结 点 指针 
Node * _ end; /终止 结 点 指针 
Polygon * _ LeftPolygon; WA 绝 段 左 多边 形 指针 
Polygon * _ RightPolygon; V/ 弧 段 右 多 边 形 指针 
public: 
Arc() |...}; /构造 函数 
~Arc() | // 析 构 函 数 
OtherMethod. . . ; /其 他 公共 操作 


| 


3. 拓扑 面 及 其 表示 


拓扑 面 是 由 一 条 或 若干 条 弧 段 首尾 相连 接 而 成 的 边线 所 包含 的 区 域 ,内 部 包 
含有 其 他 拓扑 面 的 拓扑 面 一 般 称 为 复杂 面 ,被 包含 的 拓扑 面 称 为 岛 ,没有 岛 的 拓扑 
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面 称 为 简单 面 ,如 图 5.20 所 示 。 对 于 拓扑 面 也 可 以 定义 正 反 方向 ,一般 定义 为 : 当 
沿 拓 扑面 的 边界 前 进 时 ,被 弧 段 所 包围 的 面 域 始终 处 于 强 段 的 右 侧 时 的 方向 就 是 
正方 向 ;反之 , 则 是 反方 向 。 如 图 5.21 所 示 ,箭头 所 指向 的 方向 就 是 正方 向 ,可 以 
看 出 对 于 拓扑 面 的 外 边界 , 顺 时 针 方 向 是 正方 向 ,而 对 于 内 边界 道 时 针 方 向 就 是 正 


方向 。 
简单 面 复杂 面 


图 5.20 拓扑 面 


多 边 形 一 般 包 括 多 边 形 号 .中 心 点 坐标 
多 边 形 属性 数据 ,多边形 的 组 成 弧 自 号 .多 边 。 。 一 一 一 9 
形 岛 的 信息 。 考 虑 到 组 成 弧 和 的 方向 和 多 边 

形 项 点 序列 的 方向 存在 可 能 的 不 一 致 性 以 及 / 

效率 问题 ,可 以 改 为 记录 组 成 多 边 形 的 弧 段 指 

针 和 方向 性 信息 , 即 弧 眉 方 向 与 多 边 形 的 方向 7 
是 否 一 致 。 对 于 岛 的 信息 则 通过 将 构成 多 边 ”一 一 一 一 

形 的 边线 分 块 来 处 理 的 方式 体现 ,比如 多 边 形 

包含 岛屿 , 则 可 以 使 多 边 形 的 外 边界 成 为 多 边 。 ”图 5.21 拓扑 面 的 方向 

形 的 第 一 部 分 , 岛 由 作为 多 边 形 的 第 一、 三 四 

等 部 分 的 方式 加 以 解决 。 多 边 形 的 数据 结构 可 以 表示 如 下 : 


class Polygon 
| 
public: 
class Part 
| 
private: 
typedef pair< Arc<Point> * ,bool > ArcElement; 
vector< ArcElement > _ Arcs; 
public: 
Part() 4; 
~Part() 1.…}; 
OtherMethod( ) {…|}; 
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| 
Private: 
long _ PolygonID; 
Point _ CenterPoint; 
vector<Part *> Parts; 
public: 
Polygon() 全 
~Polygon() 和 | 
OtherMethod( ) 1 …| ; 
OtherProperty() |.…}; 


| 


4. 拓扑 结 点 . 弧 段 和 面 之 间 的 关系 


拓扑 关系 生成 后 ,拓扑 结 点 .拓扑 弧 段 和 拓扑 面 之 间 的 关系 见 表 5.2 至 
表 5.5。 








表 5.2 弧 段 - 结 点 关系 表 表 5.3 结 点 - 弧 段 关系 表 
弧 段 号 结 点 号 结 点 号 弧 段 号 
Et es 
Ao Noo Nio N; A; Ai Ap** 











Ai Nio Nu 





A, No Nl 


A 








表 5.4 弧 段 -多 边 形 关系 表 表 5.5 ”多边形 - 弧 段 关系 表 
多 边 形 号 弧 段 号 


P; A, A Ac 
RE | 














5.3.2 弧 段 的 预 处 理 


拓扑 关系 自动 建立 的 第 一 步 就 是 处 理 弧 段 , 使 得 弧 段 不 存在 自 相交 和 相交 现 
象 。 本 小 节 主 要 解决 弧 段 的 处 理 问 题 。 
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1. 直线 段 相交 的 判断 方法 


直线 相交 的 判定 方法 有 很 多 种 ,这 里 介绍 较 快 的 一 种 算法 。 

设 直 线 工 过 点 Po(zo,yo) 和 点 Pi(zi, yy1), 则 直线 工 的 方程 可 以 表示 为 : 
汪汪 = 一 =+, 将 直线 方程 化 为 参数 方程 和 y= yo+ (yi yo0)t,x= zot 
1 YY0 1 ”0 
(zi 一 xX0)t 其 中 :E10,1]。 

设 有 两 条 直线 Li 和 L,, 它 们 的 参数 方程 分 别 为 
y=y%+(y yt,r=zot (zi xo)t 和 y =yo + (yr -yo)v, x =ro +t(r -rxo)v 

判断 两 线段 有 无 交点 的 关键 变 为 判断 上 和 w 是 否 符合 不 等 式 0 委 上 委 1 且 0 过 
v1。 令 : 

drz=zx1— Xxo,dy=y1- yo 
dz =x1 ~ Xo ,dy =y1 -yo 
cr 二 2Z0 -Xo0,CY=Y0 -yo 

有 ys cr'dy — cydr” Ee cr'dy— cy*dz 

dzx'dy -adyadz dz:dy — dydx’ 

如 果 dz dy -dy* dx =0, 说 明 两 线段 平行 或 者 重合 ,没有 交点 ,或 者 交点 在 
两 线段 的 头 或 尾 上 ;否则 如 果 满 足 不 等 式 0 三 1 二 1 且 0 委 " 委 1 ,两 线 自 有 交点 , 交 
点 在 两 线段 的 中 间 。 


2. 自 相交 弧 段 处 理 


具有 自 相 交 特 征 的 弧 段 至 少 具 有 4 个 ( 结 ) 节 点 ,由 3 个 点 或 2 个 点 组 成 的 弧 
段 不 可 能 自 相 交 。 依 次 取出 每 一 条 弧 段 ,如 果 绝 段 的 ( 结 ) 节 点 个 数 不 少 于 4 个 ,就 
利用 直线 段 相 交 的 方法 ,对 组 成 弧 段 的 各 直线 段 进行 判 断 ,如 果 相 交 , 将 线段 断 开 
为 两 条 , 自 相交 的 弧 段 可 能 不 止 有 一 处 相交 ,可 以 通过 递归 的 方法 将 弧 段 分 开 , 算 
法 如 下 : 

List<Arcx* > Arcs; / 弧 段 集合 

List<Rrcx > NewArcs; / 处 理 后 的 弧 段 集合 

void BreakArc(Arc x arc) 

| 





Arc * first=0; / 打 断 后 的 第 一 部 分 
Arc * second=0; / 打 断 后 的 第 二 部 分 
bool IsSelfCross= false; 

int LineCountofarc= 弧 段 所 包含 的 直线 段 数目 ; 

for(int i=0;i<LineCountofArc—2;i++ ) 
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for(int j=i+2;j<LineCountofArc;j++) 
| 
if( 直 线段 i 和 直线 段 j 相交 ) 
| 
将 交点 P 插 入 弧 段 ,并 在 P 处 将 弧 段 断 为 两 截 ,分 别 存 人 first 和 second 
中 ; 
IsSelfCross= true; 
Break; 
| 
| 
if(IsSelfCross) 
| 
break; 
| 
if(1 IsSelfCross) 
| 
NewArcs. push_ back(arc); 
| 
else 
| 
SelfCrossDeal(first); 
SelfCrossDeal( second); 


void DealSelfCross( ) 


typedef list: :iterator Position; 
for(Position ite= Arcs. begin( ); ite! = Arcs. end( ); ite++ ) 


Arc * arc = * ite; 
BreakArc(arc); 

} 

} 


3. 弧 段 相交 打 断 处 理 
弧 段 与 弧 段 相交 关系 的 判断 ,可 以 通过 取 每 一 条 弧 段 与 其 他 未 判断 过 的 所 有 
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弧 段 目标 进行 相交 关系 判断 而 得 ,从 而 要 进行 (2 一 1)+(n 一 2)+…+3+2+1= 
n(n 一 1)/2 次 判断 ,具体 方法 为 :取出 第 一 条 弧 段 ,与 其 他 n -1 条 强 段 进 行 相交 
判断 , 求 得 交点 后 ,将 交点 分 别 插入 第 一 条 弧 段 和 与 其 相交 弧 段 的 对 应 位 置 上 ,并 
记录 位 置 。 将 第 一 条 弧 段 与 所 有 其 他 弧 段 的 相交 关系 判断 完毕 后 ,通过 记录 下 的 
交点 位 置 将 第 一 条 弧 段 分 割 ,然后 依次 取出 下 一 条 弧 段 进行 同样 的 处 理 ,直到 所 有 
弧 段 处 理 完毕 。 

由 于 GIS 的 数据 量 大 ,造成 了 判断 的 工作 量 大 ,效率 低下 的 次 端 ,在 判断 两 条 
弧 段 的 关系 时 ,应 尽 可 能 地 减少 计算 量 。 减 少 计 算 量 的 工作 可 以 分 两 步 来 做 ,首先 
是 判断 两 条 弧 段 的 最 小 矩形 壁 包 (minimum bounding rectangle, MBR) 是 否 相 交 或 
具有 包含 关系 ,如 果 不 相交 或 没有 包含 关系 ,那么 可 以 断定 两 条 弧 段 是 互 不 相交 
的 ;如 果 相 交 或 具有 包含 关系 , 则 进一步 判断 第 一 条 弧 段 的 每 一 条 组 成 线段 是 否 和 
第 二 条 弧 段 的 MBR 相交 或 被 包含 ,如 果 不 相交 或 没有 被 包含 则 可 以 判断 这 一 部 
分 线段 不 会 和 第 二 条 弧 段 相交 ,否则 可 以 使 用 这 一 条 线段 与 组 成 第 二 条 弧 段 的 各 
个 线段 进行 相交 关系 的 判定 来 确定 交点 。 

弧 段 相交 打 断 处 理 的 算法 描述 如 下 : 


/计算 两 直线 段 的 交点 情况 
bool LineCross(Line * first, Line * second, Point & pl) 
| 
double dxl =first— >end— >x-first— >head— >x; 
double dx2= second— >end— >x- second— >head— >x; 
double dyl =first— >end— >y- first— >head— >y; 
double dy2 = second~ >end— >y- second— > head— >y:; 
double cx= second— >head— >x—-first— >head~ >x; 
double cy= second— >head— >y-first— >head— >y; 
double temp= dxl] x dy2 ~ dyl * dx2; 
double u= (cxx dy2 — cy* dx2)/temp; 
double v= (cx x dyl — cy * dx1 ) /temp; 
if(u>=0 && u<=1 QR v>=0 RR v<=1) 
| 
pl.x=first— >head— >xt+dxl *u; 
pl.y=first— >head— >y+dyl x*u; 
return true; 
| 
return false; 
| 


class Line 
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friend LineCross(Line * first,Line x second,Point & pl,Point & p2); 
public: 
Line(Point * ,Point * ); 
一 Line( ); 
private: 
Point * head; 
Point x end; 
public: 
OtherMethod( ); 
| 
/判断 两 个 矩形 是 否 相交 或 具有 包含 关系 
bool RectangleCross( Rectangle one, Rectangle two) 
| 
if(one. bottom> two. top || one. right < two. left || one. left > two. right | one. 
top > two. bottom) 
| 
return false; 
| 


return true; 


| 
/判断 线段 是 否 与 矩形 相交 或 被 矩形 包含 


bool LineCrossRectangle(Line line, Rectangle rect) 
{ 
Rectangle rectofline= line. MBR( ) ; 
return RectangleCross( rectofline, rect); 
| 
A 记录 插入 点 的 位 置 
void RecordPosition(vector< int >&v, int p) 
| 
for(vector< int> ::iterator it=v.begin(); it!=v.end(); it++ ) 
| 
if(x it> =p) 
| 


x*xit+ 二 1; 


} 
v.push_ back(p); 
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| 


/处 理 两 弧 段 相交 
void. TwoLineCross(Arc< Point > & one, Arc< Point > & two, vector < int>& 
forone, vector< int> & fortwo) 


if(RectangleCross(one. MBR( ) , two. MBR( ) ) ) 


vector<Point> v= one. Points(); 
Line * templine=0; 
for(vector<Point > : :iterator it=v. begin(); v.end()— it>1;) 


templine= new Line( x it, x* (++ it)) 
if(LineCrossRectangle( * templ ine, two. MBR( ) ) ) 
L 
vector< Point > v2= two. Points(); 
for{(vector<Point > ;;iterator it2= v2. begin(); v2.end()— it2>1 ;) 
| 
templine2 = new Line( x it2, x ( ++ it2)); 
Point pt; 
If(LineCross(templine,templine2 ,pt)) 
Vv. insert( it,pt); 
int p= it—v. begin(); 
RecordPosition( forone,p); 
v2. insert( it2, pt); 
p= it2 — v2. begin( ); 
RecordPosition( fortwo, p); 


| 
| 


V/ 弧 段 群 交 打 断 . 


void ArcsBreak( ) 
{ 


vector< int> * v=new vector< int > [NewArcs. size|; 


int i=0; 
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for(List<Arc * > : :iterator it= NewArcs. begin(); NewArcs. end()— it>1; 
让 十 十 , 立 十 十 ) 
| 
int j=i+1; 
for(List<Arc * > :;:iterator it2= it+1; it2!= NewArcs. end(); it2++， 
j++) 
| 
TwoLineCross( * it, * it2,v[ij,v[j]); 
| 
证 (1 v[i].empty()) 
sort(v[ 训 .begin(),v[i].end()); 
for(vector< int> ::iterator it=v[il]. begin(); it!=v[il].end(); it++) 
| 
依次 在 各 点 将 弧 段 打 断 为 两 截 ,并 存 人 弧 段 集合 ，; 
| 
从 弧 段 集合 中 ,删除 本 弧 段 ; 


| 


S$.3.3 结 点 匹配 算法 


处 理 完 弧 段 以 后 ,就 可 以 进行 结 点 匹配 了 。 结 点 匹配 就 是 把 一 定 容 差 范围 内 
的 弧 段 的 结 点 合并 成 为 一 个 结 点 ,其 坐标 值 可 以 是 取 多 个 结 点 的 平均 值 ,或 者 选中 
一 个 结 点 作为 所 有 结 点 的 坐标 区 中 心 的 坐标 ,如 图 5.22 所 示 。 


a 


图 5.22 结 点 匹配 


每 条 弧 段 对 应 着 两 个 结 点 ,每 个 结 点 在 合并 前 对 应 着 一 条 弧 段 ,在 合并 结 点 的 
过 程 中 ,需要 将 结 点 对 应 的 弧 段 也 合并 在 一 起 。 具 体 的 思路 是 将 所 有 的 结 点 加 入 
结 点 集合 ,从 结 点 集合 中 取出 一 个 结 点 作为 中 心 点 ,从 余下 的 结 点 中 找 出 容 差 范围 
内 的 其 他 结 点 ,将 这 些 结 点 所 对 应 的 弧 段 加 入 中心 结 点 的 弧 段 集合 中 ,同时 将 弧 段 
的 对 应 的 结 点 变 为 中 心 结 点 ,并 修改 弧 段 的 相应 坐标 。 算 法 如 下 : 
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/计算 两 点 间 的 距离 
double Distance(Point & one, Point & two) 
| 
double dx= two. x-one. x; 
double dy= two. y-one. y; 
return sqrt(dxx* dx+ dyx dy); 
| 
/删除 结 点 


void RemoveNode(vector < Node * > Nodes, Node * node) 
| 
for(vector< Node * > : :iterator 让 = Nodes. begin( ); it! = Nodes. end() ; it++) 
| 

if( x 让 = = node) 

! 
Nodes. erase( it); 
Break; 

| 

| 
! 


/判断 是 否 存在 重复 弧 段 
bool Contain(vector<Arc<Point > * > AMrcs, Arc * arc) 
| 
for(vector<Arc<Point > * >::iterator it= Arcs.begin() ; it! = Rrcs.end() ; 
让 十 十 ) 
if( * it==arc) return true; 
} 
return false; 
| 
/合并 结 点 
void MergeNode( ) 
| 
vector< Node * > Nodes; 
vector< Node * > DeleteNodes; 
for(List<Arc x >:;;iterator it= NewArcs. begin() ; it {= NewArcs.end() ; it++) 
| 
Nodes. push_ back( * it. Head); 
Nodes. push_ back( * it. Tail); 
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| 
while(! Nodes. empty()) 
| 
vector< Node * > :: iterator it= Nodes. begin( ); 
Node x n= x (it++ ); 
for( ; it! = Nodes.end() ; 让 ++) 
| 
if(Distance(( * (x*it)— >point), * (n— >Point) )< Tolerence) 
: 
取出 结 点 * it 所 对 应 的 弧 段 集合 ,将 它们 所 定 影 的 结 点 变 为 结 点 n, 对 应 的 坐标 序列 修改 
为 n>point, 然 后 将 弧 段 集合 中 的 弧 段 (n 中 不 存在 的 弧 段 ) 加 入 n 的 弧 段 集合 中 
DeleteNodes. push_ back( * it); 
| 
| 
依次 删除 DeleteNodes 集合 中 的 结 点 。 
| 


! 
; 


5.3.4 建立 拓扑 关系 


1. 计算 结 点 关联 弧 段 的 方位 角 , 并 按 由 小 到 大 排序 


每 个 结 点 都 关联 有 若干 条 弧 段 , 结 点 或 者 为 弧 段 的 头 结 点 或 者 为 强 段 的 尾 结 
点 , 设 结 点 为 N , 则 弧 段 的 方位 角 定 义 为 : 结 点 N 与 弧 段 上 与 其 最 接近 结 点 V 的 
连 线 与 x 轴 的 正 向 夹 角 , 如 图 5.23 所 示 。 


ee (x x 


YS 


a 


图 5.23 结 点 红 段 排序 
设 结 点 N 的 坐标 为 ( zo,yo) ,节点 V 的 坐标 为 (zi,yi), 则 有 :dz= xz1 zo， 


dy 二 yi 一 yo, 那么 有 : 
(1) 当 dx=0 时 ， 
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_ |x/2,dy>0 
“ly 
(2) 当 dz 天 0 时 ， 
arctan| dy/dzx | ,dr >0, dy 宇 0 
x—arctan| dy/dz | ,dz<0,dy>0 
n+arctan| dy/dzx | ,dz<0,dy<0 
2x — arctan | dy/dz | ,dz >0,dy<0 
计算 出 结 点 N 所 关联 的 弧 段 的 方位 角 后 , 按 角 的 大 小 将 这 些 弧 排序 ,形成 排 
序 的 关联 弧 段 集合 。 


2. 左 转 算法 


左 转 算法 的 基本 思想 是 :从 组 成 多 边 形 边界 的 某 一 条 弧 段 开始 ,如 果 该 弧 段 的 
方向 角 最 小 或 介 于 同一 结 点 的 其 他 弧 段 方向 角 之 间 , 则 道 时 针 方 向 寻找 最 小 夹 角 
偏差 所 对 应 的 缴 段 为 多 边 形 的 后 续 弧 段 ;如 有 果 该 弧 段 与 x 轴 正 向 夹 角 为 最 大 , 则 
从 该 弧 段 的 同一 结 点 出 发 的 其 他 弧 段 中 ,方向 角 最 小 的 弧 段 是 该 多 边 形 的 后 续 弧 
段 。 算 法 描述 如 下 : 

(1) 顺序 取 一 个 结 点 作为 起 始 结 点 , 取 完 为 止 ; 取 过 该 结 点 的 方位 角 最 小 的 未 
使 用 过 的 或 仅 使 用 过 一 次 , 且 使 用 过 的 方向 与 本 次 相反 的 弧 段 作为 起 始 弧 段 。 

(2) 取 这 条 弧 段 的 另 一 个 结 点 , 找 这 个 结 点 关联 的 绝 段 集合 中 的 本 条 弧 段 的 
下 一 条 弧 段 ,如 果 本 条 弧 段 是 最 后 一 条 强 段 , 则 取 弧 段 集 合 的 第 一 条 弧 段 ,作为 下 
一 条 弧 段 。 

(3) 判断 是 否 回 到 起 点 ,如 果 是 , 则 形成 了 一 个 多 边 形 ,记录 下 它 , 并 且 根 据 弧 
段 的 方向 ,设置 组 成 该 多 边 形 的 左右 多 边 形 信息 ;否则 转 (2)。 

(4) 取 起 始点 上 开始 的 ,刚才 所 形成 多 边 形 的 最 后 一 条 边 作为 新 的 起 始 弧 段 ， 
转 (2) ;车 这 条 弧 段 已 经 使 用 过 两 次 , 即 形 成 了 两 个 多 边 形 , 转 (1)。 

在 构建 多 边 形 时 要 注意 悬挂 结 点 和 悬挂 线 的 标识 ,一 般 可 以 采用 栈 的 形式 
处 理 。 

图 5.24 解释 了 多 边 形 的 创建 过 程 : 

(1) 从 Ni 结 点 开始 ,选择 具有 最 小 方位 角 的 弧 段 Ni Na 作为 起 始 弧 段 ; 转 人 
Na 点 ,根据 左 转 算法 选择 NzNs 弧 段 , 转 人 Ns 结 点 选择 NsNi 弧 段 ,形成 多 边 形 
Ai, 设 置 组 成 多 边 形 Al 的 弧 段 的 左右 多 边 形 信息 。 

(2) Ai 的 结束 弧 段 为 NsNi , 选 Ni 作为 起 始点 , NiNs 作为 起 始 弧 段 ,根据 
左 转 算法 ,形成 多 边 形 A ,设置 左右 多 边 形 信息 。 

(3) A 的 结束 弧 段 为 NANi, 选 Ni 作为 起 始点 , NiNa 作为 起 始 弧 段 , 根 据 
左 转 算法 ,形成 多 边 形 As ,这 个 多 边 形 的 方向 是 道 时 针 方 向 ,对 于 逆 时 针 方 向 的 多 
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图 5.24 左 转 算法 


边 形 , 不 设置 左右 多 边 形 信息 。 

(4) As 的 结束 弧 段 为 NNi,NiN; 已 经 被 使 用 过 两 次 ,所 以 选取 下 一 个 结 点 
N; 作为 起 始 结 点 。 从 Naz 结 点 开始 ,具有 最 小 方位 角 的 强 段 是 NzNi ,但 NzNi 
已 经 被 使 用 两 次 ,不 选 ; 

继续 选取 下 一 条 弧 段 N,N;; 然 而 上 一 次 该 弧 段 的 访问 方向 与 本 次 相同 ,所 以 
也 不 选 ;继续 选取 下 一 条 弧 段 N,N; 作为 起 始 弧 段 , 形 成 多 边 形 A4。 

(5) 依照 此 规则 形成 多 边 形 A;, 即 完成 了 图 5.24 的 拓扑 构建 , 共 可 形成 Al、 
A2、A3、A4、As 五 个 多 边 形 。 


3. 岛 的 判断 


岛 的 判断 是 指 找 出 多 边 形 互 相 包 含 的 情况 , 即 寻 找 复杂 多 边 形 。 找 到 岛 后 才 
可 以 完成 多 边 形 的 拓扑 关系 的 建立 。 

根据 左 转 算法 ,由 单条 弧 段 或 多 条 弧 段 顺序 构成 的 且 不 与 其 他 多 边 形 相交 的 
多 边 形 即 单 多 边 形 会 被 追踪 两 次 ,形成 两 个 多 边 形 ,一 个 多 边 形 节点 方向 是 顺 时 针 
的 , 另 一 个 多 边 形 的 节点 方向 是 逆 时 针 的 ,如 果 一 个 多 边 形 包 含 男 一 个 多 边 形 , 则 
必然 是 顺 时 针 多 边 形 包含 道 时 针 多 边 形 ,如 图 5.25 所 示 。 

基于 此 岛 的 判断 决定 于 多 边 形 节点 的 顺序 问题 , 多边 形 节点 的 顺序 问题 可 以 
通过 计算 多 边 形 的 面积 加 以 解决 。 任 意 多 边 形 的 面积 可 以 通过 积分 来 解决 , 设 多 
边 形 的 节点 坐标 串 为 (zx1,y1), (x2,y2)，,…, (xn,Yn) ,那么 多 边 形 的 面积 可 以 表 
示 为 


| f(z)ax 三 (yn + ya2)Az 十 村 (> + y3)Az + + 本 (yi + Jr)Az 
式 中 ,Az = zi+1 一 xi。 所 以 多 边 形 的 面积 可 以 表示 为 
Apolygor = 3 (yiy1 + Yi) CTXiti — Ki) 
根据 此 公式 , 当 多 边 形 由 顺 时 针 方 向 构成 时 ,面积 为 正 ;否则 ,面积 为 负 。 据 此 


第 5 章 空间 数据 组 织 算法 . 117 ， 





图 5.25 岛 的 判断 


得 到 解决 岛 的 判断 问题 的 算法 如 下 : 

(1) 计算 所 有 多 边 形 的 面积 。 

(2) 分 别 对 面积 为 正 的 多 边 形 和 面积 为 负 的 多 边 形 排序 ,分 别 形成 正 多 边 形 
和 人 负 多 边 形 集合 。 

(3) 如 果 负 多 边 形 集合 的 个 数 为 1 ,结束 程序 ;否则 ,从 面积 为 正 的 多 边 形 集合 
中 ,顺序 取出 一 个 多 边 形 , 如 果 正 多 边 形 已 经 都 被 访问 过 , 则 程序 结束 。 

(4) 依次 从 负 多 边 形 集合 中 取出 负 多 边 形 , 判 断 当 前 取出 的 正 多 边 形 是 否 包 
含 该 负 多 边 形 , 如 果 包 含 ,就 将 该 负 多 边 形 加 入 当前 取出 的 正 多 边 形 中 ,形成 复杂 
多 边 形 ,设置 负 多 边 形 的 组 成 弧 段 的 拓扑 信息 ,并 从 负 多 边 形 集合 中 删除 该 负 多 边 
形 。 当 所 有 负 多 边 形 都 被 访问 一 遍 后 转 (3)。 

在 上 述 算 法 中 ,判断 负 多 边 形 是 否 被 正 多 边 形 包含 是 关键 ,具体 的 算法 为 ; 

(1) 判断 负 多 边 形 面积 的 绝对 值 是 否 小 于 正 多 边 形 的 面积 ,如 果 不 小 于 , 则 负 
多 边 形 必 不 为 正 多 边 形 所 包含 ,结束 程序 ;否则 执行 下 一 步 。 

(2) 判断 负 多 边 形 的 最 小 外 接 矩 形 是 否 和 正 多 边 形 的 最 小 外 接 和 矩形 相交 或 被 
包含 ,如 果 不 相交 或 不 被 包含 , 则 负 多 边 形 必 不 被 正 多 边 形 所 包含 ,结束 程序 ;否则 
执行 下 一 步 。 

(3) 依次 取 负 多 边 形 上 的 点 ,判断 点 是 否 在 正 多 边 形 中 , 如果 所 有 点 都 在 正 多 
边 形 中 则 负 多 边 形 被 正 多 边 形 所 包含 ,否则 , 负 多 边 形 不 被 正 多 边 形 所 包含 。 


思 考题 


1. 编写 道格拉斯 - 普 克 算 法 程序 实现 矢量 数据 压缩 ,并 设计 计算 e 值 的 模型 。 
2. 编写 四 又 树 算法 程序 实现 棚 格 数据 的 压缩 。 
3. 编写 拓扑 关系 生成 程序 实现 依据 点 - 弧 关 系 构建 多 边 形 。 


第 6 革 空间 度量 算法 
6.1 直线 和 距离 


距离 计算 是 计算 机 图 形 学 和 计算 几何 中 的 基础 问题 ,并 且 有 许多 大 家 熟知 的 
公式 。 然 而 根据 对 象 表达 方式 的 不 同 , 有 不 同 的 解决 方法 。 

关于 两 点 间距 离 的 定义 ,我 们 使 用 标准 的 欧 几 里 得 距离 二 , 它 基 于 毕 达 哥 拉 
斯 定理 。 也 就 是 说 ,对 一 个 n 维 的 矢量 v= (vi,v2,…,v,), 它 的 长 度 |v| 为 


jvl2= vi+ vw 二 十 wi 二 > 


对 于 两 点 Pl(pi,p2,*, pn) 和 Ql(gq1,92,° “ ,4 ) 的 距离 为 
dD) TP = Dp 
i=1 


6.1.1 直 线 


最 初 定义 一 条 直线 工 的 方法 是 给 出 直线 上 的 不 同 的 两 点 Po。 和 Pi。 事 实 上 ， 
这 定义 了 一 条 有 限 的 从 Po 到 Pi 的 线段 。 这 就 是 希腊 人 理解 的 直线 , 它 符 合 我 们 
对 方向 和 两 点 间 最 短路 径 的 自然 的 直觉 。 延 伸 这 条 线段 的 任意 一 个 端点 会 得 到 无 
限 长 的 射线 。 当 同时 延长 两 个 端点 则 将 得 到 一 条 概念 上 的 无 限 长 的 直线 ,这 也 是 
我 们 现在 所 理解 的 直线 的 概念 。 

直线 工 也 可 以 通过 一 个 点 和 方向 来 定义 。 令 Po 是 L 上 的 一 点 ,wr 是 一 个 非 
零 矢 量 , ur 给 出 了 直线 的 方向 。 这 个 定义 等 同 于 两 点 的 定义 ,因为 我 们 可 以 设 定 
v= 二 《Pi 一 Po), 或 给 出 Po 和 vi ,可 以 选择 P; = Po + wr 为 直线 上 的 第 二 个 点 。 
如 果 vi 被 规范 化 为 单位 矢量 ,wr = vr /| vr | 那么 它 的 每 个 系数 就 是 工 的 各 个 方 
向 角 的 余弦 。 也 就 是 说 ,在 n 维 中 , 令 9;(i=1,…,n) 是 工 和 第 i 个 坐标 轴 a; 的 
夹 角 (例如 ,在 二 维 中 ,ai 是 xz 轴 ,a 是 y 轴 )。 那 么 矢量 vi = (wv), 其 中 vw;= 
cosb ,i 二 1,…,n, 是 工 的 一 个 方向 矢量 。 在 二 维 中 ,如 图 6.1 所 示 , 如 果 0 是 工 
与 工 轴 的 夹 角 ,那么 cos0, = sin9, 并 且 w = (cos01, cos86;) = (cos0, sin0) 是 上 
的 一 个 单位 方向 矢量 。 因 为 cos*9 + sin2b = 1。 同 样 ,对 于 任意 维 , 各 个 方向 余 
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弦 的 平方 和 为 1, 即 > co 0: = 1。 


Pg 





Pi=Po+tv, 


v= (cos0,cos0,) 
= (cos0 ,sing) 


6.1 通过 一 个 点 和 方向 定义 直线 


6.1.2 直线 方程 


直线 也 可 以 使 用 方程 来 定义 ,方程 中 的 未 知 数 是 点 的 坐标 。 在 实践 中 常会 遇 
到 的 有 以 下 几 种 方程 : 


f(x,y)=ar+by+c=0 
P(t1) = Po+ t vr 











非 垂直 的 二 维 直线 
















任意 维 数 的 直线 


二 维 显 式 方程 是 最 先 接触 到 的 一 个 方程 ,但 它 在 计算 机 软件 中 并 不 是 最 灵活 
的 。 隐 式 方程 更 有 用 些 , 并 且 很 容易 将 显 式 方程 转化 为 隐 式 方程 。 注 意 到 隐 式 方 
程 的 前 两 个 系数 总 是 定义 了 一 个 矢量 nL = (ea ,2) ,这 个 矢量 垂直 于 直线 L。 因 为 
对 于 直线 L 上 的 任意 两 个 点 Po = (zo,yo) .Pi= (x1,y1), 我 们 有 nL'vL= (a， 
6) (Pi-Po) = azi-zo) + b(y1-y0) =f(P1) 一 f(Po) = 0。 因 此 ,给 定 一 
个 直线 工 的 法 线 矢量 nj = (a,5) 和 上 虐 上 的 一 个 点 Po, 法 线 式 的 隐 式 方程 为 
ni‘(P—-Po)=ar+by—nr:Po=0 


如 果 e+ 多 = 工 则 称 这 个 方程 是 规范 化 的 ,并 且 x 是 一 个 单位 法 线 矢量 。 

但 是 , 仅 一 个 隐 式 或 显 式 方程 只 能 定义 二 维 中 的 一 条 直线 ,而 在 三 维 中 定义 了 
一 个 平面 ,在 维 中 , 它 定义 了 一 个 (n -1) 维 的 超 平面 。 

另 一 方面 ,在 任意 n 维 的 空间 中 ,参数 方程 是 有 效 的 并 且 是 最 通用 的 。 对 于 
一 个 用 两 点 Pe 和 Pi 定义 的 并 且 带 有 方向 矢量 vi 的 直线 ,其 方程 有 以 下 几 种 写 
法 , 即 
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P(1)= Pot+tvr=Pot+it(P1i~- Po)=(1-1)Pot hi 
式 中 ,+ 为 实数 。 在 这 个 表达 中 , P(0) = Pu， 
P(1)= Pi,P(i)(0<zt<1) 是 线段 PuPi 上 的 
一 点 ,其 中 上 = d[Po,P(zt)]/d(Po,Pi)。 因 
此 P(12)=(Po+Pi)]Z 是 线段 的 中 点 。 进 一 
步 看 ,如 果 上 <0, 那 么 P(t) 位 于 线段 之 外 ,并 
且 是 在 Po 一 边 ; 如 果 上 >1,P(i) 也 位 于 线段 之 
外 ,但 在 Pi 一 边 , 见 图 6.2。 

图 6.2 直线 的 参数 方程 定义 出 于 方便 的 需要 ,可 以 在 这 三 种 方程 表示 

形式 中 相互 转换 。 例 如 ,已 知 二 维 直线 上 的 两 
点 Po= (zo,yo),Pi= (zi,yi), 我 们 可 以 根据 这 两 点 生成 一 个 隐 式 的 方程 。 由 于 
vL=(zo,Yy)= 二 Pi 一 Po= (x1 一 xo，Y1 一 yo) 是 直线 的 方向 矢量 ,可 得 nr = (一 yy,， 
Xo) = (yo 一 y1,X1 一 X0) ,nL 是 直线 工 的 法 线 矢 量 ( 因 为 nv = 0)。 那 么 ,直线 
工 的 一 个 隐 式 方程 为 
(yo0-yi)z+(zl-Zo)y+(zoy 一 zly0)=0 

式 中 ,x 和 y 的 系数 就 是 nj 中 的 各 个 组 成 部 分 。 

例如 ,在 二 维 中 ,6 是 直线 工 与 x 轴 的 夹 角 , vr = (cosg，sing) 是 单位 方向 矢 
量 , 因 此 nL = (一 sin6，cos9) 是 一 个 单位 法 线 矢 量 。 如 果 Po = (zo, vo) 是 直线 L 
上 的 某 个 点 ,那么 一 个 规范 化 的 工 的 方程 为 

一 zsin0+ ycosO + (zosinO ~ yocos0) =0 
因为 sin20 + cos:0=1。 再 进一步 ,参数 方程 为 


P(t)=(Zzo+ztcos0,yo+ztsing) 





6.1.3 点 到 直线 的 距离 


已 知 直线 L 和 任意 一 个 点 PP, 设 d(P,L) 表 示 点 了 到 L 的 距离 。 这 是 点 P 
到 直线 的 最 短 距离 。 如 果 LL 是 一 个 有 限 的 线段 ,那么 P 在 L 上 的 基点 (过 忆 点 
作 工 的 垂 线 , 垂 线 和 工 的 交点 成 为 P 在 L 上 的 基点 ) 可 能 在 线段 之 外 ,这 就 需要 
一 个 不 同 的 计算 最 短 距离 的 方法 。 首 先 要 考虑 点 到 一 条 直线 的 垂直 距离 。 


1. 两 点 定义 的 直线 


在 二 维和 三 维 中 , 当 工 是 通过 两 个 点 Po、Pi 给 出 的 ,我 们 可 以 使 用 矢量 积 直 
接 计算 出 点 己 到 L 的 距离 。 若 是 二 维 的 ,可 以 嵌 人 到 三 维 中 , 令 第 三 个 坐标 x = 
0。 两 个 三 维 矢量 的 矢量 积 的 模 等 于 两 矢量 构成 的 平行 四 边 形 的 面积 ,因为 |v x 
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w| = |v| |w| |sin 6|, 其 中 9 是 两 个 矢量 vw 和 w 的 夹 角 。 但 是 ,平行 四 边 形 的 
面积 也 等 于 底 和 高 的 乘积 。 令 vr = PoP1=(P1- Po) 、 芭 =PoP=(P-Po), 如 
图 6.3 所 示 , 这 样 点 PP 到 直线 L 的 距离 就 是 底 PoPi 的 高 。 


图 也 
h 全 nh 


图 6.3 点 到 显 式 二 维 方程 定义 的 直线 的 距离 
那么 ,| vr Xx w| = Area( 平 行 四 边 形 (wi,w) ) = | vi| da(P,L), 这 得 出 了 


=|ur xX wl 
UL 
式 中 ,ur = wrL /iv | 为 直线 工 的 单位 方向 矢量 。 若 要 计算 多 个 点 到 同一 条 直线 的 
距离 , 则 首先 计算 ur 是 最 高 效 的 。 
对 一 个 嵌入 三 维 中 的 二 维 的 情况 ,点 P= (xz,y,0) 矢 量 积 变 为 


vLXw =(z1- xo, 0,0)X (xr- x0,y ~ y0,0) 


d(P,L)= 


《zi 一 Z0) (yl 一 20) 
(并 一 Z0) (y 一 y0) 











距离 公式 则 变 为 


d(P,L)= (yo— yrT+(zi— zo)y+ (zoy1— ziy0) 


V (x1~ x0)* + (y1— yo0) 
这 里 没有 计算 分 子 的 绝对 值 ,这 就 使 公式 计算 出 的 结果 是 带 有 符号 的 距离 , 正 
的 表示 P 点 在 直线 的 一 边 , 负 的 表示 在 直线 另 一 边 。 这 个 有 时 候 是 有 用 的 。 其 他 
情况 下 ,我 们 可 能 希望 获得 绝对 值 。 同 时 可 以 看 出 ,分子 的 形式 与 直线 隐 式 方程 的 
形式 相似 。 


2. 二 维 隐 式 方程 定义 的 直线 


”在 二 维 中 ,有 许多 情况 下 ,直线 L 是 很 容易 通过 一 个 隐 式 方程 来 定义 jz,y) 
= az+by+c = 0。 对 于 任意 二 维 ,点 P= (z,y) 距离 4(P, 工 ) 可 以 直接 用 这 个 
方程 计算 出 。 

矢量 nj = (a ,5) 是 直线 工 的 法 线 矢 量 , 利 用 ni 我 们 可 以 计算 任意 点 P 到 L 
的 距离 。 首 先 在 L 上 任意 选 一 点 Po, 然 后 将 矢量 PoP 投影 到 ny ,如 图 6.4 所 示 。 
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具体 如 下 : 

(1) 因为 a 和 2 不 同时 为 零 , 设 a <0 
或 a>0, 则 Po= (c/a,0) 位 于 直线 L 上 ; 
相反 ,如 果 <=0, 则 6<0 或 2>0, 则 Po= 
(0, 一 c/6), 最 后 的 结果 是 相同 的 。 

(2) 对 在 L 上 的 任意 点 Po 有 :nr*PoP 
= |nr| |PoP| cos 0 = |ni| da(P,L)。 

(3) 对 选 定 的 点 Po: nL:PoP=(a,5)… 





1 
h L:iaxt+by+c=0 


图 6.4 点 到 二 维 隐 式 方程 (zte/a, y) = artbytc = f(z,y) = 
定义 的 直线 的 距离 f(P) 等 同 于 (2)。 
最 后 得 出 公式 
fp)_ art+byt+c 
d(P,L)= Rs 
( 全 | nz| Va 2 十 六 


进一步 ,可 以 用 |zz| 除 f(z,y) 的 每 个 系数 ,使 隐 式 方程 规范 化 , 即 | ni |=1。 

这 样 则 得 出 非常 高 效 的 公式 
d(P,L)=f(p)=az+by+c, 当 a’+6=1 

对 每 个 距离 计算 ,这 个 公式 只 用 了 2 次 乘法 运算 和 2 次 加 法 运算 。 因 此 ,在 二 
维 中 ,车 需要 计算 多 个 点 到 同一 条 直线 L 的 距离 ,那么 先 得 到 规格 化 的 隐 式 方程 ， 
然后 使 用 这 个 公式 。 同 时 注意 到 ,只 是 比较 距离 (也 就 是 说 ,寻找 离 直线 最 近 或 最 
远 的 点 ) ,这 时 则 不 需要 规范 化 。 因 为 它 只 是 通过 乘 以 一 个 常数 因子 来 改变 距离 
的 值 。 

当 0 为 L 与 x 轴 的 夹 角 并 且 Po= (zxo,yo) 是 L 上 的 点 ,那么 规范 化 后 的 隐 式 
方程 有 :a = 一 sin6,b = cos0, 和 c = zo sin0 — yo cos0。 


3. 参数 方程 定义 的 直线 


在 ?” 维 空间 中 ,已 知 直线 工 的 参数 
方程 为 P(1)= Po+ 上 (Pi- Po),P 为 任 
意 n 维 空间 中 的 任意 一 点 。 为 了 计算 点 
PP 到 直线 工 的 距离 &(P, 工 ), 从 点 书 作 直 
线 工 的 垂 线 , 交 于 点 P(5)。 则 向 量 
PioP(2) 是 矢量 PoP 在 线段 PoPi 上 的 投 
影 ,如 图 6.5 所 示 。 

设 vL=(Pi~Po) 和 w=(P- Po)， 
则 得 到 图 6.5 点 到 参数 方程 定义 的 直线 的 距离 





h PO 
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d(Po,P(5)) |mlcosg mW wr'vr 
dl(Po,P1) | wr | vl? vrL*vr 





因而 
d(P,L)=|P-P(6)|=|w- bv|=|w— (wu)url| 
式 中 ,wu 为 直线 工 的 单位 方向 矢量 。 
这 个 公式 很 适 于 在 ” 维 空间 中 使 用 ,同时 在 计算 基点 P(6b) 也 很 用。 在 三 
维 空间 中 ,和 矢量 积 公式 同样 高 效 。 但 在 二 维 中 , 当 P(6) 不 是 必须 时 , 隐 式 公式 
的 方法 更 好 ,尤其 是 计算 多 个 点 到 同一 条 直线 的 距离 。 


4. 点 到 射线 或 线段 的 距离 


射线 以 某 个 点 Po 为 起 点 , 沿 某 个 方向 无 限 延 伸 。 它 可 以 用 参数 方程 P(z) 表 
达 , 其 中 t 宇 0、.P(0) = Po 是 射线 的 起 点 。 一 个 有 限 的 线段 由 一 条 直线 上 两 端点 
Po、Pi; 间 的 所 有 点 组 成 。 同 样 也 可 以 用 参数 方程 P(t) 表 达 , 其 中 P(0)= Po、 
P(1) = Pi 为 两 个 端点 ,并 且 点 Pi)(0 委 上 委 1) 是 线段 上 的 点 。 

计算 点 到 射线 或 线段 的 距离 与 点 到 直线 的 距离 的 不 同 点 是 ,点 了 到 直线 L 的 
垂 线 与 二 的 交点 可 能 不 位 于 射线 或 线段 之 外 。 在 这 种 情况 下 ,实际 的 最 短 距 离 是 
点 了 到 射线 的 起 点 的 距离 (图 6.6) 或 是 线段 的 某 个 端点 的 距离 (图 6.7)。 


OF 
dP, R= dP.P0) 
| \\ a(p,s) 2 
、 ~ ad(2.3) 
P(b) P(0) PDS0 0 全 信人 不 下 站. 
b<0 t<0 PO0) Ss PQ) t>1 
图 6.6 点 到 射线 R 的 距离 图 6.7 点 到 线段 S 的 距离 


对 于 图 6.6, 只 有 一 个 选择 ,就 是 计算 P 到 射线 端点 的 距离 ;而 对 于 一 条 线段 ， 
则 必须 判断 哪 一 个 端点 离 P 更 近 。 可 以 分 别 计算 点 到 两 个 端点 的 距离 ,然后 取 最 
短 的 ,但 这 不 是 最 高 效 的 办 法 , 见 图 6.7。 而 且 , 同 时 要 判断 点 了 在 直线 L 上 的 基 
点 ,是 否 在 线段 外 。 有 一 个 简便 的 方法 :考虑 PoP1、PoP 的 夹 角 , P1P、PoPi 的 夹 
角 , 如 果 其 中 有 个 角 为 90° , 则 对 应 的 线段 的 端点 就 是 在 L 上 的 基点 P(b5)。 如 
果 不 是 直角 ,PP 的 基点 必然 落 在 端点 的 一 边 或 男 一 边 ,要 看 角 是 锐角 还 是 钝 角 , 如 
图 6.8 和 图 6.9 所 示 。 这 些 考 虑 可 以 通过 计算 矢量 的 数量 积 是 正 的 ` 负 的 还 是 零 
来 判断 。 最 终 得 出 应 该 计算 点 P 到 Pu 还 是 到 Pi 的 距离 ,或 者 是 已 到 直线 工 的 
垂直 距离 。 这 些 技术 可 以 用 到 n 维 空间 中 。 
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图 6.8 计算 PoPi 与 PoP 的 夹 角 图 6.9 锐角 时 的 情况 
wo=P— Po,00E[—180°,180°] 
0 v0 
全 | 00| 之 90" 


Sqd(P,S)= ad(P, Po) 
wi1=P—Pi,00EL[ — 180°,180°] 
1 了 过 0 
Owo' vv'v 
兮 | 00| 委 90" 
Sd(P,S)=d(P,Pi) 
进一步 ,我 们 注意 到 对 两 个 夹 角 的 测试 ,可 以 只 用 两 个 数量 积 运 算 , 即 wo'w 
和 wwv, 同 时 wo*v 和 wv 是 求 P 点 在 直线 L 上 的 基点 的 P(2) 的 参数 5b 的 分 子 
和 分 母 , 这 样 我 们 可 以 依次 测试 和 计算 , 伪 代 码 如 下 : 


distance(Point P, Segment PO:P1) 
: 
v=Pl-P 
w=P—-P0 
if ((cl = wv) <= 0) 
return d(P, PO) 
if ((c2 = v'v) <= cl) 
return d(P, P1) 
b=cl/c 
Pb = P+ bv 
return d(P, Pb) 
| 


但 在 二 维 中 ,如 果 我 们 要 计算 多 个 点 到 同一 条 射线 或 线段 的 距离 ,使 用 一 个 规 
范 化 的 隐 式 方程 来 做 一 个 最 初 的 判断 ,一 个 点 已 到 工 是 否 有 一 个 新 的 最 小 的 距离 
的 测试 ,还 是 很 高 效 的 。 
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6.2 角度 量 算 


(1) 求 直 线 coz + boy+c=0 与 直线 a1x +b1iy+c=0 的 夹 角 公式 为 


aob1— aibo 





bl bo 
Qa =arctan 一 一 arctan — = arctan 
Qi ao 


当 aobi- aipo=0, 则 两 直线 平行 。 

当 aoa1 + 6b0b1=0, 则 两 直线 垂直 。 

(2) 求 矢 量 A(z, ,wy ,zs) (二 维 情形 时 A (x, ys), 这 里 指 的 是 三 维 情形 ) 与 
矢量 B(zs ,wi, zs) 的 夹 角 。 

那么 ,矢量 A、B 的 点 积 表示 为 :a b= zoxs + yw + zozs, 则 两 个 矢量 的 夹 
角 为 


aoa1 + bob1 





cos0 = 


lallzl 


6.3 多边形 面积 的 量 算 


6.3.1 三 角形 面积 量 算 
1. 古代 的 三 角形 


在 毕 达 哥 拉 斯 ( 古 希腊 哲学 家 、 数 学 家 ) 之 前 ,人 们 就 知道 平行 四 边 形 ( 包 括 矩 
形 和 正方 形 ) 的 面积 等 于 平行 四 边 形 的 底 和 高 的 乘积 。 两 个 相同 三 角形 合 在 一 起 
构成 一 个 平行 四 边 形 ,这 样 三 角形 的 面积 是 三 角形 的 底 和 高 乘积 的 一 半 , 如 
6.10 所 示 。 因 此 ,对 这 些 简 单 但 常 出 现 的 情况 有 

平行 四 边 形 :A= bh 

三 角形 :A = 地 所 

可 是 ,除了 在 某 些 特定 的 情况 下 以 外 ,三 角形 的 高 都 需要 通过 计算 顶点 到 边 的 
垂直 距离 来 获得 。 

例如 ,如 果 知 道 一 个 三 角形 两 条 边 a 、5 的 长 度 和 边 a、52 的 夹 角 ,那么 欧 几 里 
得 认为 这 些 条 件 足以 决定 一 个 三 角形 和 它 的 面积 。 采 用 三 角 函 数 ,三 角形 的 边 0 
上 的 高 h= asin0, 因 此 三 角形 的 面积 为 (图 6.11) 

A= Fabsing 
另 一 个 经 常 被 使 用 的 计算 方法 来 自 于 以 下 事实 :两 个 三 角形 的 三 条 边 都 相等 ， 
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那么 这 两 三 角形 是 全 等 三 角形 ,面积 也 相等 。 欧 几 里 得 (公元 前 300 年 左右 ) 观 测 
到 此 事实 ,海伦 (Heron of Alexandria, 公元 50 年 左右 ) 得 出 了 通过 三 条 边 计算 三 角 
形 面积 的 公式 (图 6.12), 即 


a 


» 





b 


图 6.10 平行 四 边 形 与 三 角形 面积 的 计算 图 6.11 利用 三 角 函 数 计算 三 角形 面积 





A=V ta Bo),s= 7 (atbte) 
式 中 ,a .bc 为 边 的 长 度 ;s 为 周 长 的 一 半 。 通 过 代数 变换 ,产生 以 下 令 人 感 兴趣 
的 公式 





A= IV Aa (a*+b2—c) 


这 个 公式 ( 即 Heron 公式 ) 中 只 需要 边 长 的 平方 ,这 样 则 避免 了 通过 三 角形 的 
三 个 顶点 坐标 计算 边 长 时 而 产生 的 开平 方 运算 。 
还 有 一 个 典型 的 确定 一 个 三 角形 条 件 是 :已 知 两 个 角 和 一 个 边 ,如 图 6.13 所 
示 。 知 道 了 三 角形 的 两 个 角 即 知道 了 第 三 个 角 , 因 此 ,假定 角 9 和 yp 是 边 6 的 两 
个 相 邻 的 角 。 那 么 ,面积 公式 如 下 
p2 
I 2(cot0 + cotp) 





b 


图 6.12 通过 三 条 边 计算 三 角形 面积 图 6.13 通过 一 条 边 及 该 边 相 邻 角 计算 三 角形 面积 


2. 现代 的 三 角形 


近代 ,从 17 世纪 的 笛 卡 儿 (Descartes) 、 费 马 (Fermat) 开 始 ,线性 代数 产生 了 新 
的 简单 的 面积 计算 公式 。 在 三 维 空间 中 ,平行 四 边 形 和 三 角形 的 面积 可 以 表示 为 
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两 个 矢量 边 的 矢量 积 的 模 , |vxw| = lz wsin 9|, 其 中 9 是 矢量 vw 和 了 的 
夹 角 ,因此 ,对 于 一 个 由 顶点 vo、v1、vz 构成 的 三 维 三 角形 (图 6.14), 令 v=wvi 


VO、 w=— U2 vo ,得 到 
2 Uv 2 0 0 


一 个 二 维 矢量 可 以 认为 是 钥 入 三 维 中 的 .第 三 个 维 被 设 为 0 的 三 维 矢量 
(图 6.15)。 这 样 就 可 以 计算 二 维 的 矢量 的 又 积 ,并 且 用 它 计 算 面 积 。 给 出 三 角形 
的 顶点 ,vi= (zi,y;)= (zi, yi,0), 其 中 i=0,1,2, 可 以 计算 . 
(Xx1~ x0) (x2— x0) | 
(y1- y0) (y2- yo0) 


计算 出 的 矢量 的 模 是 三 角形 面积 的 两 倍 。 但 是 ,不 计算 绝对 值 而 是 让 面积 带 
有 符号 也 是 很 有 用 的 。 








(v1— vo) X (vs — v0)= b 0， 














1 
24 = (x1— Z0) (zx2— Z0) i 所 上 1 
(yi 一 y0) (y2— y0) 
2 2》2 1 
=(zx1— x0)(y2 ~ y0) ~ (zx2— xo)(y1— yo0) 
这 里 vi = (xi, Yi)o 


这 个 面积 公式 非常 高 效 ,不 需要 计算 开 方 根 或 三 角 函 数 计算 ,只 是 2 次 乘法 运 
算 和 5 次 加 法 运算 ,可 能 还 需 一 个 除 2 运算 (有 时 可 以 避免 )。 


六 > V2 


W 
0 Vi vo A 


图 6.14 三 维 三 角形 示例 图 6.15 二 维 三 角形 示例 
注意 : 若 V0O、\、 1、 2 是 道 时针 排 列 , 面积 是 正 数 ; 若 UOQO、 U1、 U2 是 顺 时 针 排 列 9 
面积 则 是 负数 。 因 此 ,面积 计算 可 以 用 来 判断 三 角形 顶点 的 排列 方向 。 有 符号 的 
面积 可 以 用 来 判断 点 vz 在 方向 线段 vovi 的 左边 ( 正 的 ) 还 是 右边 ( 负 的 )。 因 此 ， 
面积 计算 是 个 非常 有 用 的 基本 公式 ,并 且 有 个 如 此 高 效 的 计算 公式 。 
6.3.2 四边 形 面积 量 算 


希腊 人 将 正方 形 \. 长 方形 .平行 四 边 形 、 梯 形 挑 出 特殊 对 待 。 然 后 ,对 任意 四 边 


. 128 : 地 理 信息 系统 算法 基础 


形 会 构造 一 个 面积 相等 的 平行 四 边 形 或 正方 形 。 平 行 四 边 形 的 面积 等 于 底 和 高 的 
乘积 。 但 是 ,没有 给 出 一 个 通用 的 计算 公式 。 

印度 人 婆罗 摩 般 多 (Brahmagupta 公元 620 年 左右 ) 对 Heron 的 三 角形 面积 公 
式 进 行 扩 展 , 用 来 计算 四 边 形 的 面积 。 但 是 ,这 个 公式 仅 对 共 圆 四 边 形 有 效 , 共 圆 
四 边 形 是 指 四 个 顶点 都 在 某 个 圆 上 的 四 边 形 。 对 于 一 个 共 圆 四 边 形 , 令 其 四 个 边 
的 长 度 为 :a、b、c.d,s= 二 (a +6b+c+qd)/2。 那 么 , 共 圆 四 边 形 的 面积 公式 为 

A=v(s-a)(s—-b)(s—c)(s—d) | 

这 个 公式 令 人 惊讶 的 对 称 。 如 果 某 个 边 的 长 度 为 0, 设 d =0, 则 四 边 形 即 变 
成 了 三 角形 (这 个 三 角形 的 三 个 顶点 也 在 某 个 圆 上 ) ,这 个 公式 就 退化 成 Heron 公 
式 了 。 

在 现在 的 线性 代数 中 ,平面 平行 四 边 形 的 面积 是 两 个 邻接 边 的 矢量 积 的 模 
(图 6.16) ,因此 ,对 任意 三 维 平面 四 边 形 vov1v2v3, 有 

4(zoopipzo)=|(o-vzo)x(os-oo)| 
在 二 维 中 ,顶点 vw; = (zi,y;)= (zi,yi,0)。 其 中 i=0,1,2,3, 面 积 公式 变 为 
加 (zx1— x0) (一 20) 





a 


Ys 加 这 同样 是 个 有 符号 的 面积 ,就 像 对 三 角 

形 所 采用 的 那样 。 
对 一 个 任意 四 边 形 ,我 们 可 以 通过 
Pierre Varignon 所 发 现 的 平行 四 边 形 (发 表 
"I 于 1731 年 ) 计 算 其 面积 。 很 令 人 惊讶 ,希腊 
人 错过 了 Varignon 的 简单 结论 ,在 欧 几 里 得 
图 6.16 平面 和 行 四 边 形 的 面积 量 算 后 的 2000 年 才 发 现 这 个 结论 。 对 任意 一 个 
四 边 形 , 取 四 个 边 的 中 点 为 项 点 ,构成 一 个 
新 的 四 边 形 。 很 容易 发 现 ,这 个 四 边 形 是 个 平行 四 边 形 , 称 为 “Varignon parallelo- 
gram” ,这 个 平行 四 边 形 的 面积 是 原始 的 四 边 形 的 面积 的 一 半 。 因 此 ,对 于 任意 四 
边 形 voviv2v3, 令 其 四 条 边 中 点 构成 的 平行 四 边 形 为 MoMi1M2M3a, 如 图 6.17 

所 示 。 

由 基本 的 几何 学 知识 可 以 知道 ,三 角形 vovivs 中 ,中 点 线 MoMi 平行 于 底 
vov2。 所 以 , MoM1/ M3M2。 同 样 ,MoMs/ Mi1Mi, MoMIM2NM3 是 平行 四 边 
形 。 面积 关系 很 容易 证 明 ， 我 们 可 以 按 如 下 方式 计算 四 边 形 的 面积 ; 

Anmwy =2A (Mo MI MM;) 
=2| (Mi — Mo) x (M3- Mo)| 
(2 i -| 


=2 
2 2 2 2 
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图 6.17 任意 四 边 形 面积 计算 


= | (v2 00) x (v3 0)| 


四 边 形 面积 等 于 四 边 形 的 两 个 对 角 线 的 矢量 积 的 模 。 这 个 公式 可 以 用 于 任意 
的 三 维 平面 四 边 形 。 当 这 个 公式 在 二 维 中 使 用 时 , 则 变 成 如 下 面积 公式 ; 
《zz 一 zo) (y 一 30) 
2 (zs 一 zl) (3y3 一 员 ) | 
= (x2 zo)(y3— y1) 一 (zs 一 zy 一 0) 
这 个 公式 用 于 任意 四 边 形 很 高 效 ,就 像 用 于 任 外 
意 三 角形 的 公式 那么 高 效 ,只 用 了 2 次 乘法 和 5 次 
加 法 运算 。 对 于 简单 四 边 形 , 当 顶点 逆 时 针 排 列 时 
面积 是 正 数 ; 顺 时 针 时 面积 是 负数 。 但 是 , 它 也 可 
以 用 于 非 简单 四 边 形 ,等 于 四 边 形 的 两 个 边界 区 域 
的 面积 之 差 。 例 如 , I (图 6.18) 是 非 简单 四 边 形 ”图 6.18 非 简 单 四 边 形 示 例 
vov1v2v3 的 自 相 交点 ,有 
Amyw 形 =A( 人 vovil) + A( 人 AS lv2v;) 
=A(Avovil) -A(TIv;3v;) 


vo Vl 


6.3.3 任意 二 维 平面 多 边 形 面积 量 算 


一 个 二 维 多 边 形 可 以 被 分 解 为 多 个 三 角形 。 对 计算 面积 而 言 ,有 一 个 非常 容 
易 的 分 解 简单 多 边 形 (不 自 相 交 ) 的 方法 。 如 图 6.19 所 示 , 令 一 个 多 边 形 Q 的 项 
点 为 Vi = (Zi,yi),i=0,…,n, Vn 二 Voo。P 为 一 任意 点 。 这 样 对 多 边 形 的 每 个 
边 ViVi+1 与 点 了 构成 三 角形 公 ; = 全 PViV;+1。 则 多 边 形 的 面积 为 所 有 三 角形 的 
符号 面积 之 和 。 有 


n—l] 
入 多 边 形 二 >» A( 人 分 ;), 公 ; = 全 PViVitl 
i=0 
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图 6.19 任意 二 维 平面 多 边 形 面 积 量 算 


注意 :对 于 一 个 逆 时 针 多 边 形 , 当 点 P 在 边 ViVi+1 的 左边 ,并 且 位 于 多 边 形 内 , 则 公 ， 
的 面积 是 正 的 ;相反 , 当 点 P 在 边 ViV;11 的 右边 ,并 且 位 于 多 边 形 外 部 , 则 公 ; 的 面 
积 是 灸 的 。 如 果 是 一 个 顺 时 针 多 边 形 , 则 符号 相反 ,并 且 内 部 的 三 角形 面积 为 负 的 。 

例如 ,在 上 面 的 图 中 ,三 角形 公 ， 全 PV, Vs 和 和 全, _] = 个 PV, -i V3 的 面积 
正 的 。 但 是 很 容易 观察 到 ,全 和 公 , -1 只 有 一 部 分 是 在 多 边 形 内 部 ,有 一 部 分 在 
外 部 。 另 一 方面 ,三 角形 人 Ao 和 人 1 的 面积 是 负 的 ,这 样 就 抵消 了 面积 为 正 数 的 三 
角形 在 多 边 形 外 部 的 那 部 分 面积 。 最 终 , 外 部 的 面积 会 被 全 部 抵消 掉 。 

可 以 通过 设 定 特 定 的 点 已 和 扩展 条 件 ,使 公式 更 清楚 。 选 P = (0,0) 
(图 6.20) ,每 个 三 角形 的 面积 简化 为 24( 公 ;) = (ziy;+1 一 Zi+1yi)。 这 样 就 产生 


n~l 
2Agwy = >) (ziyir — Tit1y:) 
i=0 


n-l 
= > (zi + Zi 一 你) 
i 


2 Zi Vi+1 一 Yi-1) 
i=1 


这 里 ， V;= (zi, yi)o 





图 6.20 点 了 为 (0,0) 时 的 情况 
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只 需 少许 的 代数 运算 , 即 可 看 出 第 二 和 第 三 个 求 和 公式 等 价 与 第 一 公式 。 对 
一 个 及 个 顶点 的 多 边 形 。 第 一 个 公式 用 了 2n 次 乘法 运算 和 (2n - 1) 次 加 法 运 
算 ; 第 二 个 公式 用 了 2” 次 乘法 运算 和 (3n 一 1) 次 加 法 运算 ;第 三 个 只 用 了 n 次 乘 
法 运算 和 (2n 一 1) 次 加 法 运算 。 所 以 ,第 三 个 公式 是 最 高 效 的 ,但 是 为 了 避免 计算 
imod 7 ,必须 将 多 边 形 的 顶点 数组 升 为 V+1= Vi。 

这 个 计算 对 于 一 个 多 边 形 会 产生 一 个 符号 面积 ,就 像 一 个 三 角形 的 符号 面积 
那样 。 当 顶点 是 逆 时 针 排 列 时 面积 是 正 的 , 顺 时 针 时 面积 是 负 的 。 因 此 ,面积 计算 
可 以 判断 多 边 形 的 整体 方向 。 但 是 ,有 其 他 的 高 效 的 方法 判断 多 边 形 的 方向 。 最 
简单 的 一 个 方法 是 找到 最 右边 的 最 低 的 顶点 ,然后 判断 进入 这 个 顶点 和 离开 这 个 
点 的 边 的 方向 。 这 个 判断 可 以 通过 检查 离开 边 的 最 后 顶点 是 否 在 进入 边 的 左边 ， 
左边 即 意 味 着 是 逆 时 针 。 


6.3.4 任意 三 维 平面 多 边 形 面积 量 算 

1. 经 典 算法 

另 一 个 重要 问题 是 如 何在 三 维 空间 中 计算 平面 多 边 形 的 面积 。 前 面 已 展示 了 
一 个 三 维 的 三 角形 全 VoViV, 的 面积 为 它 的 两 个 边 的 矢量 积 的 模 的 一 半 , 即 
了 WwwxVovz|。 

这 有 一 个 经 典 的 计算 三 维 多 边 形 的 标准 公式 ,这 个 公式 扩展 了 三 角形 的 矢量 
积 公 式 。 它 来 自 于 斯 托 克 斯 定理 (Stokes Theorem)。 但 是 ,这 里 会 展示 如 何 从 三 
维 的 三 角形 分 解 得 到 这 个 公式 ,三 角形 分 解 在 几何 上 会 更 直观 。 


n 
Pp 


图 6.21 三 维 平面 多 边 形 的 分 解 


如 图 6.21 所 示 ,一 个 一 般 的 三 维 平 面 多 边 形 Q 包含 顶点 V; = (xz;, yi,zi) 其 
中 i=0,…,n,V,= Vo。 所 有 的 顶点 都 在 一 个 相同 的 三 维 平面 x 上 ,此 平面 具有 
单位 法 线 矢量 n。 现 在 ,就 像 在 二 维 空间 中 , 令 已 是 一 个 任意 的 三 维 点 (并 不 要 求 
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在 平面 x 上 ); 对 Q 的 每 个 边 e; = ViVi+1, 构 成 三 维 三 角形 公 ; = 全 PViV;+1。 我 
们 要 找到 这 些 三 角形 面积 的 和 与 多 边 形 Q 的 面积 之 间 的 关系 。 但 是 现在 已 有 的 
是 一 个 以 多 边 形 为 底 ,P 为 项 点 的 锥 形 。 我 们 需要 将 这 些 三 角形 的 边 投影 到 平面 
x 上 。 计 算 经 过 投影 的 三 角形 的 符号 面积 。 如 果 我 们 能 够 这 样 做 ,那么 经 过 投影 
的 面积 的 总 和 等 于 平面 多 边 形 的 面积 。 





图 6.22 三 角形 投影 面积 的 计算 


如 图 6.22 所 示 为 了 能 够 这 样 做 ,首先 ,对 每 个 三 角形 公 ; 关联 一 个 面积 矢量 a 
=1/2(PV;X PVi+1), 这 个 面积 矢量 垂直 于 三 角形 公 ; ,并 且 面 积 矢 量 的 模 等 于 三 
角形 的 面积 。 然 后 , 作 点 P 到 平面 x 的 垂 线 , 交 平 面 于 点 Po, 则 投影 过 的 三 角形 
为 T= 全 PoViV;+1。 作 边 e; = ViVi+1 的 垂 线 PoB;, 交 边 于 点 B;。 因 为 , PP 垂 
直 于 ei, 三 个 点 PPoB; 定义 的 平面 与 e; 垂直 ,并 且 PB; 是 点 已 到 边 e 的 垂 线 。 所 
以 ,| PBi| 是 三 角形 公 ; 的 高 ,并 且 | PoB; | 是 三 角形 T; 的 高 。 进 一 步 看 , | PB, | 和 
| PoBi; | 的 夹 角 =0=n 和 a; 的 夹 角 。 这 样 有 如 下 公式 : 


A(T) = 地 | ViVi+1| | PoB; | | ViVi+1| | PB; | cosg 


=A(A;)cos0= |n| |a;|cosb 
=n'a; 
从 矢量 n 所 指 的 方向 看 平面 x ,如 果 T, 的 顶点 方向 是 逆 时 针 ， 面积 是 正 的 。 
如 同 二 维 的 情况 一 样 ,我 们 可 以 将 所 有 的 三 角形 T; 的 符号 面积 相 加 ,获得 多 边 形 
的 面积 。 公 式 如 下 


it 
局 
xs 
XxX 
局 
= 
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最 后 , 选 PP 点 为 P=(0,0,0)( 见 图 6.23), 则 PV; = V 产生 如 下 简化 的 公式 ， 
2A 多 边 形 三 1 ， (V; Xx Vi#1) 
这 个 公式 用 了 6n +3 次 乘法 运算 和 4n +2 次 加 法 运算 。 





图 6.23 点 了 为 (0,0,0) 时 的 情况 


与 二 维 空间 中 相似 ,从 矢量 ”所 指 的 方向 看 平面 r, 如 果 多 边 形 的 定向 方向 是 
逆 时 针 , 则 面积 是 正 的 。 


2. 四 边 形 分 解 


使 用 四 边 形 分 解 代 替 三 角形 分 解 来 可 以 提高 多 边 形 面 积 的 计算 速度 。 分 析 三 
维 平面 四 边 形 Vo Vi Vz Vs 的 面积 等 于 其 对 角 线 的 矢量 积 的 模 , 即 
2A 四 动 形 三 7"[(V2 一 V0o)x(V3 一 V1)] 
这 个 公式 将 原来 四 个 又 积 运算 降 到 一 个 又 积 运算 。 
然后 ,任何 顶点 数 大 于 4 的 多 边 形 可 以 被 分 解 为 多 个 四 边 形 。 四 边 形 由 Vo 
和 其 他 三 个 有 序 的 顶点 V2; -1、V2;、V2i+1 构 成 ,i=1,…,h。 其 中 ,hh 是 小 于 或 等 
于 (n 一 1)/2 的 最 大 整数 。 如 果 n 是 奇数 ,那么 最 后 一 个 是 三 角形 。 公 式 如 下 : 


h-l 
2Ami 形 = 1， ( 2 Va = VO) Xx (Vain — V1) + (Vo — Vo) xX (Vi — V1)) 
i=1 


式 中 , 当 n 为 奇数 时 k=0;n 为 偶数 时 &= n 一 1。 这 个 公式 使 计算 又 积 的 次 数 减 
少 到 一 半 ( 被 矢量 减 运算 代替 )。 这 个 公式 总 共 需 要 3n + 3 次 乘法 运算 和 5n + 1 
次 加 法 运算 ,大 致 上 快 一 倍 。 


3. 投影 到 二 维 平面 
将 三 维 的 多 边 形 投影 到 二 维 的 平面 上 ,可 以 提高 计算 的 速度 。 然 后 ,用 二 维 的 
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多 边 形 面积 计算 公式 计算 ,再 乘 以 一 个 比例 因子 就 可 以 得 到 三 维 多 边 形 的 面积 。 
可 以 通过 忽略 三 维 多 边 形 的 某 个 坐标 轴 上 的 值 ,投影 到 另 两 个 轴 构 成 的 平面 上 。 
为 了 避免 退化 和 提高 计算 的 健壮 性 ,检查 平面 的 法 线 矢量 n(az + by+ cz+d= 
0) ,将 系数 绝对 值 最 大 的 坐标 轴 忽 略 。 令 Proj. (nn ) 是 忽略 了 坐标 c= xz、y 或 z 的 
投影 。 则 投影 过 的 多 边 形 的 面积 与 原始 多 边 形 的 面积 之 比 为 
有 投影 后 的 多 边 形 | ze| 或 
A 3 ea | 了 | CC 一 之 
三 维 多 边 形 

式 中 ,n 为 原始 多 边 形 的 法 线 矢量 2 = (zzzyzz)i7t 为 my7zy7z 中 的 一 个 。 
所 以 ,三 维 平面 面积 的 计算 多 一 个 额外 乘法 运算 ,这 个 算法 总 共用 了 n+5 个 乘法 
运算 ,2n +1 个 加 法 运算 ,一 个 开 方 运算 ( 当 ”不 是 一 个 单位 矢量 ) ,加 上 选择 投影 
平面 所 需 的 消耗 。 这 对 于 标准 的 公式 来 讲 是 个 显著 的 提高 ,提高 了 几乎 6 倍 。 


思 考题 


1. 编写 程序 实现 点 到 直线 距离 的 计算 。 
2. 编写 程序 实现 两 直线 夹 角 的 计算 。 
3. 编写 程序 实现 多 边 形 面积 的 计算 。 
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空间 索引 就 是 指 依据 空间 对 象 的 位 置 和 形状 或 空间 对 象 之 间 的 某 种 空间 关 
系 , 按 一 定 的 顺序 排列 的 一 种 数据 结构 ,其 中 包括 空间 对 象 的 概要 信息 ,如 对 象 的 
标识 、 外 接 和 矩形 及 指向 空间 对 象 实体 的 指针 。 空 间 索引 是 对 存储 在 介质 上 的 数据 
位 置信 息 的 描述 ,用 来 提高 系统 对 数据 获取 的 效率 。 

空间 索引 的 提出 是 由 两 方面 决定 的 :其 一 是 由 于 计算 机 的 体系 结构 将 存储 器 
分 为 内 存 、 外 存 两 种 ,访问 这 两 种 存储 器 一 次 所 花费 的 时 间 一 般 为 30 一 40ns、8 一 
10ms, 可 以 看 出 两 者 相差 10 万 倍 以 上 。 尽 管 现在 有 “内 存 数据 库 ” 的 说 法 ,但 绝 大 
多 数 数据 是 存储 在 外 存 磁 盘 上 的 。 如 果 对 磁盘 上 数据 的 位 置 不 加 以 记录 和 组 织 ， 
每 查询 一 个 数据 项 则 要 扫描 整个 数据 文件 。 这 种 访问 磁盘 的 代价 则 会 严重 影响 系 
统 的 效率 ,因此 系统 的 设计 者 必须 将 数据 在 磁盘 上 的 位 置 加 以 记录 和 组 织 ,通过 在 
内 存 中 的 一 些 计算 来 取代 对 磁盘 漫 无 目的 的 访问 ,才能 提高 系统 的 效率 。 尤 其 是 
GIS 涉及 的 是 各 种 海量 的 复杂 数据 ,索引 对 于 处 理 的 效率 是 至 关 重 要 的 。 其 二 是 
GIS 所 表现 的 地 理 数 据 多 维 性 使 得 传统 的 也 树 索引 并 不 适用 ,因为 也 树 所 针对 的 
字符 ,数字 等 传统 数据 类 型 是 在 一 个 良 序 集 之 中 , 即 都 是 在 一 个 维度 上 ,集合 中 任 
给 两 个 元 素 ,都 可 以 在 这 个 维度 上 确定 其 关系 只 可 能 是 大 于 、 小 于 ,等 于 三 种 。 若 
对 多 个 字段 进行 索引 ,必须 指定 各 个 字段 的 优先 级 形成 一 个 组 合 字段 。 而 地 理 数 
据 的 多 维 性 ,在 任何 方向 上 并 不 存在 优先 级 问题 ,因此 B 树 并 不 能 对 地 理 数 据 进 
行 有 效 的 索引 ,所 以 需要 研究 特殊 的 能 适应 多 维特 性 的 空间 索引 方式 。 


7.1 B 树 与 B' 树 


”BB 树 索 引 结 构 是 关系 数据 库 中 用 的 最 广泛 的 索引 ,虽然 B 树 与 B- 树 并 不 适应 
空间 数据 的 管理 ,但 B 树 的 设计 思想 对 空间 索引 的 研究 提供 了 思路 ,起 到 了 重要 
作用 ,所 以 在 这 里 有 必要 介绍 一 下 B 树 。B 树 的 实现 主要 依赖 于 索引 域 中 排序 的 
存在 。 前 面 提 到 空间 数据 不 存在 特定 依赖 的 索引 域 ,所 以 空间 数据 索引 的 研究 关 
键 是 设计 索引 域 ,对 空间 数据 进行 分 类 和 排序 。 对 空间 数据 进行 分 类 和 排序 会 破 
坏 空间 数据 的 相 邻 性 ,也 正 是 因为 破坏 了 空间 数据 的 相 邻 性 , 才 将 多 维 的 空间 信息 
映射 到 一 维 的 索引 域 。 
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7.1.1 B 树 索引 结构 
1. B 树 定义 


B 树 是 一 种 平衡 的 多 路 查找 树 ,其 定义 如 下 : 

一 个 m 阶 的 B 树 ,或 为 空 树 ,或 是 为 满足 下 列 特征 的 mx 叉 树 。 

(1) 树 中 每 个 结 点 至 多 有 x 棵 子 树 ; 

(2) 若 根 结 点 不 是 叶子 结 点 , 则 至 少 有 两 棵 子 树 ; 

(3) 除根 之 外 的 所 有 非 终端 结 点 至 少 有 [mm /21 棵 子 树 ; 

(4) 所 有 的 非 叶 结 点 中 包含 下 列 信 息 数 据 : 

(Ao, <Ki,A,DI>, < Eb, D>,…, <K,, A,,D,>) 

式 中 ,Ki(i=1,…,n) 为 关键 字 , 且 K;<Kiwi(i=1,…,n 一 1);Ai(i=0,…,n) 为 
指向 子 树 根 节点 的 指针 , 且 指 针 A;_1 所 指 的 子 树 中 所 有 结 点 的 关键 字 均 小 于 K; 
(i 三 1,…,n);A 所 指 的 子 树 中 所 有 结 点 的 关键 字 均 大 于 K, ;DD， 为 数据 指针 , 指 
向 关键 字 K; 所 在 的 数据 记录 。 

<K,A,D> 称 为 结 点 的 一 个 元 素 。 

(5) 所 有 的 叶子 结 点 都 出 现在 同一 层次 上 ,并 且 不 带 信 息 ( 可 以 看 作 是 外 部 结 
点 查询 失败 的 结 点 ,实际 上 这 些 结 点 不 存在 ,指向 这 些 结 点 的 指针 为 空 )。 


2. B 树 的 存储 结构 


B 树 的 所 有 结 点 都 储存 在 外 部 存储 设备 中 (如 磁盘 ) 中 ,通常 一 个 结 点 的 大 小 
为 磁盘 抉 的 整数 倍数 , 树 中 的 指向 子 树 的 指针 都 是 外 部 存储 设备 的 地 址 。 在 B 树 
的 所 有 算法 中 都 会 尽力 减少 磁盘 的 读 写 次 数 ,提高 效率 。 


3. B 树 查找 算法 


设 查 找 关键 字 为 K, 首 先 将 根 结 点 读 人 人 内存, 在 结 点 中 查找 关键 字 KK, 若 找 到 
则 取出 关键 字 K 对 应 的 数据 指针 D, 查 找 结束 。 若 未 找到 K, 则 需 找 出 K; ,使 得 
K;_1<K<K;, 读 出 A; 所 指 的 磁盘 中 的 结 点 ,如同 在 根 结 点 中 搜索 一 样 继续 查找 ， 
直到 叶 结 点 。 在 查找 K; 的 过 程 中 , 若 i=1, 则 读 出 Ao 所 指 的 磁盘 中 的 结 点 。 

在 搜索 过 程 中 ,从 根 至 外 部 结 点 路 径 上 的 所 有 内 部 结 点 都 有 可 能 被 搜索 到 , 因 
此 ,磁盘 访问 次 数 最 多 是 h(h 是 B 树 的 高 度 )。 

例如 ,在 图 7.1 所 示 的 B 树 中 搜索 KK=27。 首 先 读 人 根 结 点 c ,比较 27< 
35 , 读 左 结 点 0,27>18 , 读 右 结 点 e ,找到 了 27, 查找 结束 。 在 查找 过 程 中 读 磁 
盘 3 次 。 
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图 7.1 一 个 4 阶 的 B 树 ,每 个 结 点 最 多 有 4 棵 子 树 ,除根 结 点 外 所 有 非 叶 结 点 至 少 有 两 棵 子 树 


4. 树 的 插入 算法 


设 将 元 素 <K,A,D> 插 入 BB 树 中 。 

(1) 首先 在 树 中 查找 氏 , 若 查找 到 ,算法 结束 (假定 B 树 中 不 容许 有 相同 的 关 
键 字 存在 )。 若 没 查找 到 , 设 最 后 查找 的 结 点 为 N。 将 关键 字 KK 插入 结 点 N 中 ， 
车 结 点 N 的 元 素 的 个 数 小 于 等 于 m -1, 将 A 指向 叶 结 点 ,插入 结束 。 若 结 点 N 
的 元 素 关 键 字 的 个 数 为 x , 则 需 分 裂 结 点 N。 

(2) 设 插 入 关键 字 K 后 的 NN 的 结 点 情况 如 下 : 

(Ao, <Ki,Ai,DI>, < Ehy, D>,%, <K,, An,D, >) 

创建 一 新 结 点 L ,将 N 中 的 第 | mx 人 2+1 1 以 及 其 后 的 所 有 元 素 , 共 m 一 [m /21 
个 元 素 移 人 新 结 点 L 中 。 再 将 元 素 <KTm /21,ATm/21,Dim/21> 移 出 N, 插 入 
结 点 N 的 父 结 点 。N 的 父 结 点 还 可 能 需要 分 裂 ,最 坏 的 情况 是 分 裂 一 直 延 续 到 
根 结 点 ,最 后 产生 一 新 的 根 结 点 , 树 高 增加 1。 

当 揪 人 操作 引起 了 * 个 结 点 的 分 裂 时 ,磁盘 访问 的 次 数 为 h( 读 取 搜 索 路 径 
上 的 结 点 )+2s( 回 写 两 个 分 裂 出 的 新 结 点 ) +1( 回 写 新 的 根 结 点 或 插入 后 没有 导 
致 分 裂 的 结 点 )。 因 此 ,所 需要 的 磁盘 访问 次 数 是 h +2s +1, 最 多 可 达到 3h + 1。 

例如 ,在 图 7.1 中 播 人 <48,D> 。 首 先 查 找 开 = 48, 未 查 到 K= 48; 最 后 访问 
的 结 点 是 g。 将 KK=48 插入 此 结 点 中 ,(<47,D>,<48,D>,<53,D>,<64, 
D> ) ,元 素 个 数 4>3 , 结 点 需 分 裂 。 

(<47,D>,<48,D>,<53,D>,<64,D>) 分 裂 为 两 个 结 点 (<47,D>)、 
(<53,D> ,<64,D>)。 将 元 素 <48,D> 揪 人 (<47,D> ,<48,D>,<53,D>， 
<64,D>) 的 父 结 点 4 ,结果 如 下 (图 7.2):(<43,D>,<48,D>,<78,D> ) 此 结 
点 满足 要 求 ,不 需要 进一步 分 裂 。 播 人 算法 结束 ,结果 B' 树 为 ; 
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整个 插入 算法 共 分 裂 一 次 ,所 需 磁盘 访问 次 数 为 3+2+1=6 次 。 





图 7.2 在 图 7.1 中 插 和 人 <48,D> 的 结果 


5. B 树 的 删除 算法 


设 待 删除 的 元 素 的 关键 字 为 K, 所 在 的 结 点 为 N。 删 除 操作 分 为 两 种 情况 : 
OK 所 在 的 结 点 为 最 下 层 的 非 叶 结 点 。@OK 所 在 的 结 点 不 是 最 下 层 的 非 叶 结 点 ， 
可 以 用 左 相 邻 子 树 中 的 最 大 元 素 ,也 可 以 用 右 相 邻 子 树 中 的 最 小 元 素来 替换 被 删 
除 元 素 ,这 样 @ 就 转化 为 D0。 以 下 讨论 情况 的 删除 操作 ,有 三 种 可 能 。 

(1) K 所 在 的 结 点 N 中 元 素 的 个 数 不 小 于 [mm /21, 则 只 需 从 其 中 删除 元 素 
<K,A,D> , 树 的 其 余部 分 不 变 。 

(2) K 所 在 的 结 点 N 中 元 素 的 个 数 等 于 [xx /21 一 1, 而 与 其 相 邻 的 左 兄弟 (或 
右 兄弟 ) 结 点 中 元 素 的 个 数 大 于 [mz /21 一 1, 则 需 将 其 兄弟 结 点 中 的 最 小 (或 最 大 ) 的 
关键 字 上 移 至 父 结 点 中 ,而 将 父 结 点 中 小 于 (或 大 于 ) 且 紧 靠 该 上 移 关键 字 的 关键 
字 下 移 至 被 删除 关键 字 所 在 的 结 点 中 。 这 样 被 删除 的 结 点 中 的 元 素 的 个 数 就 等 于 
[fm /21 一 1, 满足 条 件 。 

(3) K 所 在 结 点 N 的 左右 兄弟 结 点 中 的 元 素 个 数 都 等 | xn /21 一 1。 设 元 素 
<Ki,Ai,Di> 中 ,Ai; 指向 N 的 右 兄弟 (或 左 兄 弟 ) 结 点 。 将 删除 后 的 NN 中 剩余 的 
元 素 加 上 元 素 <K;,A;,D; > 一 同 移 至 NN 的 右 兄弟 (或 左 兄弟 ) 结 点 。 如 果 因 此 N 
的 父 结 点 的 个 数 为 [ma 21 -2, 则 依次 类 推 。 

对 于 高 度 为 h 的 B 树 的 删除 操作 ,最 坏 情 况 出 现在 当 合 并 发 生 在 h, 有 h 一 
1,…, 3, 2 层 时 ,需要 从 最 相 邻 兄弟 中 获取 一 个 元 素 。 最 坏 情 况 下 磁盘 访问 次 数 
是 3h = (找到 包含 被 删除 元 素 需 要 h 次 读 访 问 ) + (获取 第 2 至 h 层 的 最 相 邻 兄 
弟 需 要 有 h 一 1 次 读 访 问 )+ (在 第 3 至 h 层 的 合并 需要 h -2 次 写 访问 ) + (对 修改 过 
的 根 结 点 和 第 2 层 的 两 个 结 点 进行 3 次 号 访问 )。 
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例如 ,在 图 7.1 中 ,删除 元 素 <11,D> ,此 时 结 点 a 变 空 ,其 右 兄弟 结 点 e 的 
元 素 个 数 为 fm 和- 1(m =4) ,属于 第 (3) 种 情况 ,元 素 C18,D> 指 向 (<27,D> )。 
需 将 元 素 <18,D> 与 <27,D> 合 并 ,合并 后 结 点 5 变 空 ,其 右 结 点 4d 的 元 素 个 数 
为 Im]2l(m =4), 属 第 (2) 种 情况 , 需 将 元 素 <43,D> 移 到 根 结 点 中 ,<35,D> 移 
到 2 原来 所 在 的 结 点 中 ,最 终结 果 如 图 7.3 所 示 。 





图 7.3 删除 结 点 后 的 结果 


6. 算法 实现 示例 


以 下 算法 简要 描述 了 B 树 的 查找 操作 的 实现 。 
由 于 B 树 主要 用 作文 件 的 索引 , 它 涉及 外 存 的 存 取 ,在 此 略 去 外 存 的 读 写 , 只 
作 示 意 性 描述 。 假 设 结 点 类 型 如 下 说 明 。 


##define m4 / 树 的 阶 , 暂 定 为 4 
上 typedef struct BINode 


| 


int keynum; / 结 点 中 关键 字 的 个 数 
struct BINode  * parent; /指向 父 结 点 
KeyType x*key[m+1]; /关键 字 ,0 号 单元 未 用 
Struct BINode xptr[m+1];  // 子 树 指针 矢量 
Record * recptr[m+1]; /记录 指针 矢量 ,0 号 单元 未 用 
| 
Typedef struct 
| 
BINode x pt; /指向 找到 的 结 点 
int i; V1...m, 在 结 点 中 的 关键 字 序 号 


int tag; A 1: 查 找 成 功 ,0: 查 找 失败 
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| Result 


Result SearchBTree(BTree T, KeyType K) 
| 
/在 m 阶 B 树 上 查找 关键 字 kK, 返 回 结果 (pt,i,tag)。 若 查找 成 功 , 则 特征 值 tag= 1， 
/指针 pt 所 指 结 点 中 第 i 个 关键 字 等 于 ;否则 特征 值 tag=0, 等 于 KX 的 关键 字 应 插入 
/在 指针 pt 所 指 结 点 中 第 i 和 第 i+ 1 个 关键 字 之 间 。 
P=T;q= NULL; found = FALSE; i=0;// 初 始 化 ,p 指向 待 查 结 点 ,q 指向 p 的 父 结 点 
while (p && | found ) 
| 
n=p— >keynum; i= Search(p, K); /在 p- >key[1...keynum] 中 查找 i, 使 得 : 
Ap- >keyli] <= K<p— >key[i+1] 
if (i>0 && p- >keyli]= =K) found = TRUE; /找到 待 查 关 键 字 
else 
| 
gq=pip=p- >ptr[i]; 
| 
| 


If (found) return (p,i,1); /查找 成 功 
else return (q,i,0); /查找 不 成 功 ,返回 K 的 插入 位 置信 息 
| /Search BTree 


7.1.2 B+ 树 索引 结构 - 


B' 树 是 B 树 的 改进 ,在 B 树 中 ,数据 指针 可 以 出 现在 树 的 任 一 级 。 在 B* 树 
中 ,数据 指针 仅 出 现在 叶 结 点 。B'!' 树 的 叶 结 点 的 结构 与 内 结 点 的 结构 不 同 。 在 内 
结 点 中 出 现 的 每 一 个 关键 字 , 在 叶 结 点 中 都 存在 。 

一 棵 m 阶 的 B' 树 必须 满足 下 列 条 件 : 

(1) 每 个 结 点 至 多 有 m 棵 子 树 。 

(2) 除根 结 点 和 叶 结 点 以 外 ,每 个 结 点 至 少 有 [zm /2] 棵 子 树 。 如 果 根 结 点 不 是 
树 的 唯一 一 个 结 点 , 它 至 少 有 两 棵 子 树 。 

(3) 每 个 内 结 点 包含 下 列 信息 数据 。 

(<Al, Ki>, <As, Eo>, 7, <A， 1 K，1>，<A,,K,>), 其 中 ,K;(; 
=1,…,n) 是 关键 字 , 征 K;<Kiwi(i=1,…,n 一 1);Aj(i=1,…,n) 为 指向 子 树 
的 指针 , 且 指 针 A;_1 所 指 的 子 树 中 所 有 结 点 的 关键 字 均 小 于 等 于 K;(i = 1,…， 
n),A。 所 指 的 子 树 中 所 有 结 点 的 关键 字 均 大 于 K,。 
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(4) 及 棵 子 树 的 结 点 中 含有 个 关键 字 。 

(5) 所 有 的 叶子 结 点 中 包含 了 全 部 关键 字 的 信息 及 指向 含 这 些 关 键 字 记录 的 
指针 , 且 叶 子 结 点 本 身 依 关键 字 的 大 小 自 小 而 大 顺序 连接 。 | 

(6) 所 有 的 非 叶子 结 点 可 以 看 成 是 索引 部 分 , 结 点 中 仅 含 有 其 子 树 ( 根 结 点 ) 
中 的 最 大 (或 最 小 ) 关 键 字 。 

B! 树 的 查找 算法 \ 插 入 和 删除 的 过 程 基 本 上 与 B 树 类 似 。 只 是 在 查找 时 非 叶 
结 点 上 的 值 等 于 关键 字 时 ,查找 并 不 停止 ,而 是 一 直到 叶 结 点 ,因为 数据 指针 在 叶 
结 点 ,如 图 7.4 所 示 。 





四 四 5 四 四 呈 和 四 因 基因 四 四 罗 ! 
图 7.4 _ B+ 树 实例 
7.2 R 树 结构 


Guttman 受到 B* 树 的 启发 ,在 1984 年 提出 了 RR 树 , R 树 的 查询 效率 高 ,上 且 适 
用 范围 广 , 能 够 支持 高 维 的 空间 对 象 。 此 后 ,Sellis 等 (1987) .Greene(1989) .Beck- 
mann 等 (1990)、 Kamel(1994) 和 Garcia(1998) 等 在 其 基础 上 不 断 地 进行 改进 ,提出 
了 R 树 的 多 种 变形 ,形成 了 一 个 R 树 类 索引 体系 。 


7.2.1 R 树 定义 


R 树 是 一 种 类 似 于 B 树 的 动态 平衡 树 (图 7.5)。R 树 的 结 点 由 若干 个 结构 为 
(T, PointerToChild) 的 单元 组 成 。 
I=(11,1,,.…,1,) 
式 中 ,n 为 空间 对 象 的 空间 维 数 ; I; 则 为 第 i 维 上 的 坐标 范围 [a ,5] ,为 一 闭 区 间 。 
在 非 叶 子 结 点 中 ,了 为 包含 其 所 有 子 结 点 的 最 小 包含 矩形 (MBR)。 如 图 7.5 中 的 
虚线 矩形 。 而 在 叶子 结 点 中 ,了 为 空间 对 象 的 MBR。 
PointToChild 是 个 指针 ,指向 子 结 点 。 但 在 叶子 结 点 中 ,是 空间 对 象 的 标识 符 
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图 7.5 R 树 的 结构 


(identifier, ID)。 根 据 ID, 可 以 检索 到 空间 对 象 的 详细 信息 。 

Guttman(1984) 参 照 B 树 的 定义 形式 ,给 出 了 RR 树 的 定义 。 其 中 设 M 为 结 点 
中 单元 的 最 大 数目 ,m (1 过 m 志 M2) 为 非 根 结 点 中 单元 个 数 的 下 限 。 

(1) 每 个 叶子 结 点 包含 的 单元 个 数 介 于 m 与 M 之 间 ,除非 它 同 时 是 根 结 点 。 

(2) 每 个 叶子 结 点 中 的 单元 (了 , SpatialObjectID) 中 ,了 是 包含 该 n 维 空间 对 象 
的 MBR, SpatialObjectID 是 该 空间 对 象 的 ID。 

(3) 每 个 非 叶子 结 点 的 子 结 点 数 介 于 m 和 M 之 间 , 除 非 它 是 根 结 点 。 

(4) 每 个 非 叶 子 结 点 的 单元 (了 ,PointerToChild) 中 ,了 是 包含 子 结 点 的 MBR， 
PointerToChild 是 指向 子 结 点 的 指针 。 通 过 该 指针 能 访问 到 子 结 点 。 

(5) 根 结 点 最 少 有 两 个 子 结 点 ,除非 它 同时 是 叶子 结 点 。 

(6) 所 有 的 叶子 结 点 都 处 于 树 的 同一 层 上 。 


7.2.2 R 树 索引 的 主要 操作 算法 
在 定义 了 R 树 结构 的 基础 上 ,Guttman(1984) 还 给 出 了 R 树 的 搜索 .插入 、 删 
除 .分裂 等 主要 操作 的 算法 。 


1. 搜索 算法 


类 似 于 其 他 树 的 搜索 算法 ,R 树 的 搜索 算法 也 是 一 个 递归 过 程 。 设 搜索 区 域 
为 S, 则 搜索 区 域 S 内 空间 对 象 的 过 程 如 下 : 
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(1) [ 子 树 的 搜索 ] 一 一 从 R 树 的 根 结 点 工 开始, 如果 了 结 点 不 是 叶子 结 点 ， 
则 依次 判断 该 结 点 中 各 单元 的 了 与 区 域 S 的 空间 关系 ,如 果 了 与 搜索 区 域 S 相 
交 , 则 以 该 单元 所 指 的 结 点 为 子 树 的 根 节点 ,重复 上 面 的 操作 。 如 果 了 结 点 是 叶 
子 结 点 则 转 至 第 二 步 。 

(2) [叶子 结 点 的 搜索 ] 一 一 如 果 工 是 叶子 结 点 ,依次 判断 其 中 各 空间 对 象 与 
搜索 区 域 S 的 空间 位 置 关系 ,如 果 空 间 对 象 落 在 搜索 区 域 S 内 ,表明 其 满足 搜索 
条 件 。 


2.. 插入 算法 


R 树 的 另 一 个 重要 操作 是 在 R 树 中 插入 一 个 新 的 空间 对 象 。 该 插 人 算法 与 也 
树 的 插入 算法 相 类 似 , 能 够 保证 树 的 平衡 ,使 所 有 叶子 结 点 都 处 在 树 的 同一 层 上 。 

新 空间 对 象 的 插入 操作 : 

(1) [为 新 的 空间 对 象 ,寻找 一 个 合适 的 叶子 结 点 ] 一 一 选择 合适 的 叶子 结 点 
L( 该 过 程 在 下 面 另 外 介绍 ) 来 存放 新 的 空间 对 象 。 

(2) [将 新 的 空间 对 象 记录 到 叶子 结 点 中 ] 一 一 如 果 结 点 工 中 尚 有 空位 (单元 
数 小 于 M) , 则 在 工 中 记录 新 空间 对 象 的 MBR 和 ID。 如 果 没 有 空位 , 则 将 工 结 
点 中 的 单元 (包括 新 的 空间 对 象 ) ,分 成 两 个 部 分 ,分 别 记录 在 结 点 L 和 新 生成 的 
结 点 LL 中 。 结 点 的 分 裂 方 法 另外 介绍 。 

(3) [调整 树 的 结构 ] 一 一 从 叶子 结 点 上 开始 ,对 R 树 结构 进行 调整 。 

(4) [生成 新 的 根 结 点 ] 一 一 如 果 由 于 子 结 点 的 分 裂 ,导致 根 结 点 中 单元 个 数 
超过 M , 则 需 将 根 结 点 分 裂 成 两 个 结 点 ,并 再 生成 一 个 新 结 点 作为 R 树 的 根 结 点 ， 
而 原 根 结 点 分 裂 成 的 两 个 结 点 作为 其 子 结 点 。 此 时 R 树 增加 1 层 。 

选择 合适 的 叶子 结 点 : 

(1) [初始 化 ] 一 一 令 NN 为 RR 树 的 根 结 点 。 

(2) [判断 是 否 为 叶子 结 点 ] 一 一 如 果 N 为 叶子 结 点 , 则 返回 N。N 即 为 要 找 
的 叶子 结 点 。 

(3) [选择 合适 的 子 树 ] 一 一 如 果 N 结 点 不 是 叶子 结 点 ,将 新 空间 对 象 依次 
加 入 到 该 结 点 的 各 单元 ,分 别 计算 工 的 面积 ,其 中 面积 增加 最 小 的 单元 所 在 的 子 
树 即 为 合适 的 子 树 。 令 N 为 该 单元 所 指 的 子 结 点 ,从 (2) 开 始 重复 进行 上 面 的 
步骤 。 

调整 树 的 结构 : 

(1) [初始 化 ] 一 一 令 N 为 叶子 结 点 L, NN 为 因 新 空间 对 象 的 插 和 人 而 分 裂 生 
成 的 新 的 结 点 (如 果 有 的 话 )。 

(2) [判断 是 否 是 根 结 点 ] 一 一 如 果 N 为 根 结 点 , 则 停止 返回 。 

(3) [调整 父 结 点 相应 单元 的 中 一 一 调整 结 点 N 的 父 结 点 P 中 与 其 相应 单元 
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的 工 ,使 其 正好 包含 N 结 点 中 的 所 有 单元 。 

(4) [根据 需要 进一步 分 裂 父 结 点 ] 一 -如果 存在 因 分 裂 生成 的 新 结 点 NN， 
则 在 N 的 父 结 点 P 中 加 入 指向 该 结 点 的 单元 ,如 果 已 结 点 中 单元 个 数 超过 M , 则 
需 分 裂 结 点 已 ,从 而 生成 一 个 新 的 结 点 PP ,并 令 N= P,NN = PP。 从 (2) 步 开始 
重复 上 面 的 步骤。 

通过 上 面 的 分 裂 算法 可 以 动态 地 加 入 新 的 空间 对 象 , 且 不 破坏 及 树 的 平衡 。 


3. 删除 算法 


类 似 于 插 人 算法 ,删除 算法 也 能 保证 R 树 的 平衡 。 

空间 对 象 的 删除 操作 : 

(1) [确定 删除 空 0 R 树 的 搜索 算法 ， 确定 删 
除 空间 对 象 所 在 的 叶子 结 点 工 。 

(2) [删除 空间 对 象 ] 一 一 将 结 点 工 中 空间 对 象 所 在 的 单元 删除 。 

(3) [调整 RR 树 ] 一 一 从 叶子 结 点 工 开始 调整 R 树 的 操作 。 这 一 步 保 证 结 点 
( 根 结 点 除外 ) 中 单元 数 不 低 于 其 下 限 x 。 

(4) [调整 根 结 点 ] 一 一 如 果 R 树 调整 后 , 根 结 点 只 有 一 个 孩子 , 则 将 根 结 点 删 
除 , 让 其 孩子 结 点 成 为 R 树 的 根 结 点 ,此 时 尺 树 减少 1 层 

由 于 空间 对 象 的 删除 会 导致 结 点 的 单元 数 小 于 m， ee 情况 ,提高 
结 点 的 利用 率 ,需要 将 R 树 进行 调整 ,保证 每 个 结 点 ( 根 结 点 除外 ) 的 单元 数 不 小 
于 mo 

R 树 的 调整 算法 : 

(1) [初始 化 ] 一 一 令 N 为 被 删除 单元 的 叶子 结 点 工 。Q 为 结 点 的 集合 ,用 以 
存放 被 删除 的 结 点 ,初始 化 为 空 

(2) [寻找 N 在 父 结 点 中 的 相应 应 单元 ] 一 一 如 果 N 为 根 结 点 则 转 至 步骤 (6)。 
反之 查找 其 父 结 点 ,并 找到 与 N 结 点 相对 应 的 单元 En。 

(3) [删除 单元 数 小 于 m 的 结 点 ] 一 一 如 果 结 点 N 的 单元 数 小 于 mx, 则 在 结 
点 卫 中 删除 单元 EN, 并 将 结 点 N 加 入 集合 Q 中 。 

(4) [调整 相应 的 MBR] 一 一 如 果 结 点 N 没有 被 删除 , 则 调整 单元 EN 中 了 ,使 
其 正好 包含 结 点 N 中 的 所 有 单元 。 

(5) [调整 上 一 层 ] 一 一 令 N= 卫 ,从 步骤 (2) 开 始 重复 上 述 操作 。 

《6) [被 删除 结 点 重新 插入 到 尺 树 中 ] 一 一 采用 R 树 的 插入 算法 ,将 Q 中 的 所 
有 被 删除 的 结 点 重新 插入 到 R 树 中 。 
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4. 分 裂 算 法 


R 树 的 结 点 分 裂 算 法 是 R 树 的 一 个 重要 算法 。 如 何 将 一 个 矩形 集 分 成 适当 
的 两 部 分 (图 7.6) ,是 影响 R 树 检索 效率 的 一 个 重要 因素 。Guttman(1984) 以 面积 
作为 标准 , 即 分 裂 后 的 两 部 分 MBR 面积 和 最 小 。 该 算法 基于 穷 举 的 思想 , 列 出 各 
种 符合 要 求 的 组 合 , 从 中 选取 面积 和 最 小 的 组 合 。 


人 mammamnamng 









| 


rr 





LE 


好 的 分 裂 情 况 


图 7.6 结 点 分 裂 算 法 比较 


但 该 算法 存在 较 大 的 缺陷 , 即 复 杂 度 太 高 ,近似 于 2%-1, 随 着 M 的 增 大 ,耗费 
的 时 间 呈 指数 上 升 。 同 时 在 RR 树 插入 空间 对 象 时 , 结 点 分 裂 算 法 被 频繁 调用 ,这 
会 导致 建立 R 树 索 引 耗 时 增加 。Guttman 为 此 提出 了 复杂 度 分 别 为 平方 和 线性 的 
两 个 近似 算法 。 本 文 着 重 介 绍 平方 耗费 算法 (Quadratic-Cost Algorithm)。. 

该 算法 为 一 近似 算法 ,复杂 度 为 M*。 算 法 分 两 步 ,首先 从 要 分 裂 的 矩形 集中 
选取 在 分 裂 后 最 不 可 能 在 同一 类 中 的 两 个 矩形 作为 种 子 , 作 为 两 类 中 的 第 一 个 矩 
形 ,然后 将 剩 下 的 矩形 依次 分 配 到 这 两 类 中 。 但 该 算法 不 能 保证 分 裂 后 的 面积 和 
为 最 小 。 

平方 耗费 算法 : 

(1) [为 两 类 选取 第 一 个 和 矩形] 一 一 选择 两 个 最 不 可 能 在 同一 类 的 矩形 作为 种 
子 , 分 别 赋 给 两 类 ,作为 类 中 的 第 一 个 矩形 。 

(2) [是 否 需要 停止 分 配 ] 一 一 如 果 和 矩形 集中 的 矩形 均 已 分 配 完 毕 , 则 分 裂 操 
作 结 束 , 返 回 。 如 果 将 矩形 集中 剩 下 的 矩形 都 加 入 到 某 一 类 中 ,才能 使 其 矩形 的 个 
数 等 于 m , 则 将 所 剩 矩 形 都 分 配给 该 类 ,并 结束 分 裂 操作 ,返回 。 

(3) [分 配 矩 形 ] 一 一 对 矩形 集中 剩 下 的 矩形 进行 分 配 , 选 取 其 中 的 某 一 个 矩 
形 , 加 入 到 其 中 一 类 ,基本 判 据 是 该 类 在 加 入 该 矩形 后 ,MBR 面积 增加 最 小 。 若 两 
类 面积 增加 值 相等 , 则 选 未 加 入 前 MBR 面积 最 小 者 。 若 此 前 MBR 面积 相等 , 则 
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选 矩形 数 最 少 者 。 若 抢 形 数 也 相等 , 则 可 将 该 矩形 分 配给 其 中 的 任何 一 类 。 从 步 
又 (2) 开 始 重 复 上 面 的 操作 。 

选取 种 子 和 矩形 (pick seeds): 

(1) [计算 各 对 抢 形 的 也 值 ] 一 一 对 于 抑 形 集中 的 任何 两 个 矩形 A 和 B, 设 J 
为 包含 A、B 矩形 的 MBR, 计 算 D= Area(]) Area(A)- Area(B); 

(2) [选取 种 子 矩 形 对 ] 一 一 选择 DD 值 最 大 的 矩形 对 作为 种 子 和 矩形 。 

选择 进行 分 配 的 矩形 : 

(1) [计算 各 和 矩形 的 Di 与 D; 值 ] 一 一 对 于 和 矩形 集中 其 余 和 矩形 ,分 别 计 算 并 进 
行 分 配 , 各 类 MBR 的 面积 增长 Di 与 DD; 的 值 ; 

(2) [选取 矩形] 一 一 选取 Di 与 D 相差 最 大 的 矩形 作为 要 分 配 的 矩形 。 

Guttman 还 给 出 了 一 个 复杂 度 更 低 的 分 裂 方 法 一 一 线性 耗费 算法 (Line-Cost 
Algorithm)。 该 算法 与 Quadratic-Cost Algorithm 类 似 ,但 在 选择 种 子 和 矩形 和 分 配 
矩形 时 采用 更 为 简单 的 方法 ,相应 的 分 裂 结果 比 上 面 的 方法 更 为 粗略 。 





7.2.3 R* 树 算法 


在 Guttman 之 后 ,Sellis 等 (1987) 和 Green(1989) 从 局 部 优化 的 角度 对 R 树 
进行 了 改进 ,德国 不 菜 梅 大 学 的 Beckmann 兼顾 局 部 优化 和 整体 优化 ,于 1990 年 
提出 了 R* 树 是 R 树 发 展 过 程 中 的 一 个 重要 里 程 碑 。Sellis (2000) 在 ACM 
SIGMOD Digital Review 上 撰文 对 R* 树 进行 了 回顾 和 展望 ,充分 肯定 了 R* 树 的 
重要 地 位 。 

以 下 是 Beckmann 对 R 树 所 作 的 改进 。 


1. 局 部 优化 一 一 衡量 指标 的 多 元 化 


在 分 裂 结 点 和 选取 最 优 子 树 的 衡量 指标 的 多 元 化 , 除 采用 面积 指标 外 ,还 引入 
了 有 周 长 和 重奏 部 分 面积 作为 判定 指标 (Beckman et al. ,1990)。 

(1) 在 结 点 分 裂 上 ,Beckmann 等 采用 与 Green(1989) 相 类 似 的 近似 分 裂 算法 ， 
同时 加 入 周 长 和 重合 部 分 作为 判定 的 指标 ; 

(2) 在 选择 子 树 过 程 中 ,对 于 非 叶子 结 点 层 子 树 的 选择 还 是 沿用 Guttman 的 
面积 增 量 作为 标准 , 而 叶子 结 点 层 子 树 的 选择 采用 互相 重 释 部 分 增 量 作为 标准 。 


2. 整体 优化 一 一 强制 重新 插入 算法 (Forced Reinsert Algorithm) 


上 面 曾 提 及 ,对 于 同一 个 空间 对 象 集合 ,空间 对 象 插 入 的 顺序 不 同 , 会 得 到 结 
构 不 同 的 RR 树 。 这 表明 新 空间 对 象 的 加 入 受到 先前 插入 的 空间 对 象 的 影响 。 在 
新 空间 对 象 加 入 后 ,原先 的 空间 索引 未 必 还 能 较 好 地 反映 空间 对 象 之 间 的 空间 位 


第 7 章 空间 数据 索引 算法 ， 147 . 





置 关系 。 而 这 势必 影响 到 后 面 空间 对 象 的 插 人 ,最 终 导致 的 整个 R 树 整体 结构 合 
理性 的 降低 ,影响 了 查询 的 效率 。 针 对 上 述 问题 ,R" 树 提出 对 索引 中 已 有 结 点 中 
的 单元 进行 有 选择 的 重新 插入 ,以 优化 R 树 的 整体 结构 。 

强制 重新 插 人 算法 的 思路 : 当 新 空间 对 象 的 插 人 导致 结 点 中 单元 数 超标 时 ,对 
结 点 中 的 单元 重新 判断 ,并 在 索引 树 中 同 层 的 其 他 结 点 中 进行 动态 调整 ,以 推迟 结 
点 的 分 裂 ,从 而 达到 对 R 树 的 整体 结构 进行 优化 的 目的 。 该 算法 的 详细 过 程 如 
下 。 

溢出 处 理 一 一 处 理 单元 数 超过 M 的 结 点 N(N 不 是 根 结 点 ), 选 择 结 点 中 的 
适当 的 单元 重新 插入 ,或 分 裂 结 点 N。 

(1) 若 N 是 所 在 层 的 第 一 个 溢出 结 点 , 则 调用 重新 插入 过 程 ,选择 N 结 点 中 
若干 个 适当 的 单元 重新 插入 ; 

(2) 反之 , 则 分 裂 结 点 N。 

重新 插入 机 制 一 一 从 指定 结 点 N 中 选择 若干 个 适当 的 单元 ,重新 插入 到 同 层 
的 其 他 结 点 中 。 

(1) 分 别 计算 结 点 N 中 的 M + 1 个 单元 的 MBR 的 中 心 到 结 点 N 的 MBR 的 
中 心 的 距离 D; 

(2) 将 各 单元 按 值 从 大 到 小 排列 ,取出 前 P(1<P<M 一 m+1) 个 单元 , 调 
用 插入 算法 ,插入 到 同 层 的 其 他 结 点 中 。 


7.3， 四 叉 树 结构 


区 域 型 物体 的 四 又 树 (Quad-tree) 表 示 方 法 最 早出 现在 加 拿 大 地 理 信 息 系统 
CGIS 中 。20 世纪 80 年 代 以 来 ,四 又 树 编码 在 图 像 分 割 \ 数 据 压缩 地 理 信息 系统 
等 方面 进行 了 大 量 研究 ,对 四 又 树 数据 结构 提出 了 许多 编码 方案 。 


7.3.1 常规 四 又 树 


四 叉 树 分 割 的 基本 思想 是 首先 把 一 幅 图 像 或 一 幅 栅 格 地 图 (2” x 2”,n >>1) 等 
分 成 4 部 分 , 逐 块 检查 其 栅 格 值 。 若 每 个 子 区 中 所 有 栅 格 都 含有 相同 值 , 则 该 子 
区 不 再 往 下 分 割 。 否 则 ,将 该 区 域 再 分 割 成 4 个 子 区 域 。 如 此 递归 地 分 割 ,直到 
每 个 子 块 都 含有 相同 的 灰 度 或 属性 值 为 止 。 这 样 的 数据 组 织 称 为 自 上 往 下 (Top- 
to-Down) 的 常规 四 又 树 。 四 叉 树 也 可 自 下 而 上 (Down-to-Top) 地 建立 。 这 时 ,从 
底层 开始 对 每 个 栅 格 数据 的 值 进行 检测 ,对 具有 相同 灰 度 或 属性 的 四 等 分 的 子 区 
进行 合并 ,如 此 递归 向 上 合并 。 

图 7.7 表示 了 四 又 树 的 分 解 过 程 。 图 中 对 33 x2 的 栅 格 图 ,利用 自 上 而 下 方 
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第 2 层 


第 3 层 





7.7 常规 四 叉 树 及 其 分 解 过 程 


法 表示 了 寻找 栅 格 A 的 过 程 。 从 四 又 树 的 特点 可 知 ,一 幅 2 x 2” 栅 格 阵列 图 , 具 
有 的 最 大 深度 数 为 n ,可 能 具有 的 层次 为 0,1,2,3,…,n。 
每 层 的 栅 格 宽度 , 即 为 每 层 边 长 上 包含 的 最 大 栅 格 数 ,反映 了 所 在 叶 结 点 表示 


的 正方 形 集合 的 大 小 。 其 值 为 
2 (最 大 深度 - 当前 层次 ) 


第 7 章 空间 数据 索引 算法 «149 ， 





例如 ,一 幅 23x 2 的 栅 格 阵列 , 它 具 有 最 大 深度 为 3， 可 能 层次 分 别 为 0,1， 
2,3。 其 中 : 

第 0 层 边 长 上 的 最 大 栅 格 数 为 22 -0= 8; 

第 1 层 边 长 上 的 最 大 栅 格 数 为 22-1= 4; 

第 2 层 边 长 上 的 最 大 栅 格 数 为 2 “= 2 

第 3 层 边 长 上 的 最 大 栅 格 数 为 2 = 1; 

当 栅 格 阵列 为 非 2* x2" 时 ,为 了 便于 进行 四 叉 树 编码 可 适当 增加 一 人 
其 满足 2" x 2"。 

常规 四 叉 树 所 占 的 内 外 存 空 间 比 较 大 ,因为 它 不 仅 要 记录 每 个 结 点 值 ,还 需 记 
录 结 点 的 一 个 前 趋 结 点 及 四 个 后 继 结 点 ,以 反映 结 点 之 间 的 联系 。 对 机 格 数据 进 
行 运 算 时 ,还 要 作 遍 历 树 结 点 的 运算 。 这 样 就 增加 了 操作 的 复杂 性 。 所 以 实际 上 ， 
在 地 理 信息 系统 或 图 像 分 割 中 不 采用 常规 四 叉 树 ,而 用 线性 四 叉 树 (linear Quad- 


tree)o 
7.3.2 线性 四 又 树 


从 数据 结构 角度 看 , 树 数 据 结构 本 身 属 于 非 线性 数据 结构 。 这 里 所 说 的 线性 
四 又 树 编码 是 指 用 四 又 树 的 方式 组 织 数据 ,但 并 不 以 四 叉 树 方式 存储 数据 。 也 就 
是 说 , 它 不 像 常规 四 又 树 那样 存储 树 中 各 个 结 点 及 其 相互 间 关系 ,而 是 通过 编码 四 
又 树 的 叶 结 点 来 表示 数据 块 的 层次 和 空间 关系 。 所 说 的 叶 结 点 都 具有 一 个 反映 位 
置 的 关键 字 , 亦 称 位 置 码 ,以 此 表示 它 所 处 位 置 。 其 实质 是 把 原来 大 小 相等 的 栅 格 
集合 转变 成 大 小 不 等 的 正方 形 集合 ,并 对 不 同 尺寸 和 位 置 的 正方 形 集合 赋予 一 个 
位 置 码 。 

图 7.8(a) 显 示 的 栅 格 数据 图 ,其 中 属性 值 为 1, 背景 值 为 0。 该 图 的 线性 四 又 
树 表示 可 通过 19 个 叶 结 点 来 描述 。 图 中 叶 结 点 (1) 一 (19) 分 别 表示 不 同 斥 二 的 正 
方形 集合 。 所 以 ,线性 四 又 树 的 关键 是 如 何 对 叶 结 点 进行 编码 ,通常 说 的 各 种 四 又 
树 编码 法 的 差异 ,主要 在 于 表示 位 置 码 的 编码 方法 不 同 。 


7.3.3 线性 四 又 树 的 编码 


讨论 对 线性 四 叉 树 编码 之 前 ,首先 讨论 一 下 四 叉 树 编码 中 采用 的 自 上 而 下 分 
割 以 及 自 下 而 上 的 合并 过 程 。 设 一 个 n x n 的 栅 格 阵列 (n = 2*,k >1) 对 其 进行 
自 上 而 下 分 割 过 程 ,可 如 下 用 四 进 制 码 说 明 。 

第 一 次 分 割 得 第 一 层 , 这 里 用 Pu, Pi , P; , P3 ,表示 如 下 
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Oooo 


(9) : (10) :3 
1 | 


So: 


(11) (12) ; (18) ; (19) 
0 :0 :0 :0 





第 0 层 
第 ] 层 
第 2 层 
0) (00 GD (12) (17) (18) (19) 
第 3 层 
WW (5) (9 0 (13) (04 (15) (16) 
(b) 


图 7.8 线性 四 又 树 编码 
ee Oe 
PoDPL[i,;] (= 


第 二 次 分 割 得 第 二 层 , 这 里 用 
Poo, Poi, Po, Po, P10, Pu, P12, P13, P20, Pai, P22, P23, P30, P31, P32, P33 表 
示 如 下 


PDOPL[i,;] (= 了 rain 


._ 工 | ) 
SN 十 。17 一 一 一 十 
1 27 1 737 77 工 ,7m 


1 1 
pl (11 da-1 la) 
PooDOP[i,;] i=] 4 1 47 


; 1 Sl 1 ) 
7 et —Xny:7 二 一 十 一 一 
PiDPL 7 (:; 1, 0 73 47 1,3n 





es ed 有 1 ) 
i 十 > 
PioDPLi,;] (i V6 1,3 7 1, 7 
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PunOPLli,;] (+ 
Pa3DP[Li (= 二 Dan+lal 
以 下 以 此 类 推 。 
上 述 各 式 中 “一 "表示 包含 ;0、.1.2.3 分 别 表示 左上 、 右 上 、 左 下 、 右 下 , 即 NW、 
NE、SW.、SE 部 分 。 
其 中 位 置 码 的 位 数 决定 分 割 的 层 数 ,图 形 越 复 杂 , 分 割 的 层 数 越 多 ,相应 的 位 
置 码 的 位 数 亦 越 多 。 
这 种 自 上 而 下 的 分 割 方法 需要 大 量 重复 运算 ,效率 比较 低 , 从 而 出 现 了 自 下 而 
上 的 合并 法 。 


自 下 而 上 的 合并 法 ,首先 根据 栅 格 阵列 的 行列 值 转换 成 最 大 位 数 的 位 置 码 , 然 
后 对 上 述 编码 进行 排序 ,依次 检查 4 个 相 邻 位 置 码 的 属性 值 是 否 相 同 , 若 相 同 将 其 
进行 合并 ,并 除去 一 位 最 低位 置 码 ,这 样 不 断 循环 直到 没有 可 合并 子 块 为 止 。 这 种 
自 下 而 上 合并 法 , 因 效 率 高 而 得 以 采用 。 

下 面 进一步 介绍 几 种 线性 四 又 树 的 编码 。 


1. 基于 深度 和 层次 码 的 线性 四 又 树 编码 


它 通 过 记录 叶 结 点 的 深度 码 和 层次 码 来 描述 叶 结 点 的 位 置 码 。 
对 一 幅 2"x 2" 栅 格 图 ,具有 2” 层 ,选用 2? 位 作 层 次 码 。 
图 7.8 所 示 的 线性 四 又 树 中 叶 结 点 (7) 的 编码 如 表 7.1 所 示 


表 7.1 叶 结 点 (7) 的 编码 








该 位 置 码 的 十 进 制 值 为 
20+21+24+25+26+27= 243 
表 7.2 表示 了 图 7.8 所 示 的 19 个 叶 结 点 的 全 部 编码 值 。 


2. 基于 四 进 制 的 线性 四 又 树 编码 


四 又 树 的 “四 等 分 "概念 ,从 数据 结构 的 角度 看 很 适合 用 四 进 制 来 表示 。 
例如 ,一 幅 2" x 2" 的 顶 格 图 ,用 四 又 树 描述 时 最 多 有 n 层 , 所 以 可 用 ”位 四 
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进 制 数 表示 所 有 位 置 码 。 图 7.8 的 2 x 23 栅 格 图 中 , 叶 结 点 (7) 的 编码 如 表 7.3 
所 示 。 


表 7.2 叶 结 点 位 置 码 




























































































叶 结 点 号 二 进 制 码 十 进 制 码 
1 0 "0 [oo1o 0|olollloel| 2 
2 0 | 010 1 | 0 0|0o|ol1|1o 6 | 6 
Go | 3 | 0 
4 0 | 0 1 | 1 olfolololrriliiilols 
5 olfolriiiforiololi a 
6 oilolririiriiorololri | 217 
7 0|0111111 0 1|112|14| 3 
8 0 | 1|o1o10 0 1|2|15|7 
9 1 olololololilolrsiila 
10 L|0o0|o11|lo|lolo 0 | | 5 17| 8 
11 1 | 0 Eo Og Gd ol sl|4 2 
1| oil1 ololololiliol7|iol sé 
1 | tol 0 | 0 0| 1|1|7|:， 1 
1|1|0 0 | 1 0|1|1|71s817 
1|1|0 1 | 0 orl1i1 gs|o| 3 
fi0 1 | 1 0| 1|1|8|11|9 
| | 
1 ,110 0 | 0 0| 1|o|lsg|131| 34 
1|1|1 0 | 0 人 






































下 面 以 自 下 而 上 方法 ,说 明 四 进 制 编码 过 程 。 首 先 将 栅 格 阵列 的 行列 值 分 别 
转换 成 二 进 制 码 ,得 二 进 制 行 号 及 , 列 号 I 。 然 后 求 出 四 进 制 四 又 树 编码 M = 2 
x 到 +。 如 二 进 制 第 001 行 ,第 101 列 的 M 码 为 M=2x1+101=103; 二 进 制 
第 111 行 ,第 111 列 的 M=2x111+111= 333。 

反之 ,已 知 四 叉 树 四 进 制 编码 值 ,也 可 求 二 进 制 行列 值 。 其 算法 为 ,首先 明确 
M 码 对 行 , 列 方向 的 贡献 ,归纳 如 下 : 

若 该 位 的 编码 值 为 0,1 则 对 行 号 到 贡献 值 为 0; 

若 该 位 的 编码 值 为 2,3 则 对 行 号 1 贡献 值 为 1; 
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若 该 位 的 编码 值 为 0,2 则 对 列 号 I 贡献 值 为 0; 
若 该 位 的 编码 值 为 1,3 则 对 列 号 六 贡献 值 为 1。 
这 样 ,如 果 已 知 M 码 为 103, 则 二 进 制 行列 值 如 下 : 










AM 码 
二 进 制 行 值 Ly 
二 进 制 列 值 LE 








这 表示 M 码 为 103 单元 处 于 第 1 行 第 5 列 ,同样 如 果 已 知 M 码 为 333, 则 其 
二 进 制 行列 值 为 
AM 码 3 3 3 
二 进 制 行 值 I 1 1 1 


这 表示 M 码 为 333 的 单元 ,处 于 第 7 行 第 7 列 ,利用 上 述 方法 ,对 每 个 栅 格 进 
行 编码 得 图 7.9(a) 编 码 表 。 然 后 将 编码 值 排序 。 检 查 相 邻 4 个 码 的 属性 值 ,如 相 
同 ,进行 合并 ,除去 最 低位 。 例 如 图 7.9(a) 中 ,000、001、002、003 相 邻 四 位 码 具 有 
相同 属性 值 ,为 此 进行 合并 ,其 编码 值 改 成 为 00。 以 此 类 推 , 这样 经 过 一 次 全 检测 
后 ,再 检测 上 层 的 相 邻 四 个 块 编码 的 属性 值 , 如 相同 再 合并 。 如 此 循环 直到 没有 能 
够 合并 的 子 块 为 止 ,最 后 得 图 7.9(b)。 
| 
Nao on oo for oo io moj 
000| 000| 007 | o10 [o1 | 1o0| 101 | 110 {11 | 
001| 002| 003| 012 [013| 102| 103| 112 [113 | 
[010[020|021|030[031[ 1201 121| 1301 131 
[ou1 | 0221023[T0321033| 122| 123| 132| 133 | 
| 100| 200| 201 [21012111 3001 301| 3101311 | 
[101| 202 | 203| 212 | 213| 302 | 303| 312 | 313 


| 10 | 220 | 221 | 230 | 231 | 320 | 321 | 330 | 331 | 


eo 
















(a) (b) 
图 7.9 四 又 树 的 四 进 制 编码 


这 种 编码 的 优点 是 便于 实现 行列 值 及 编码 值 之 间 的 转换 。 由 于 栅 格 数据 结构 
中 的 数据 通常 用 二 维和 矩阵 来 表示 ,实现 这 种 转换 ,便于 对 四 又 树 的 操作 。 

这 种 编码 的 缺点 是 存储 器 开销 大 ,加 上 一 般 软 件 都 不 支持 四 进 制 码 ,通常 要 用 
十 进 制 码 来 表示 每 位 四 进 制 码 。 显 然 , 这 样 既 浪费 了 存储 空间 ,也 影响 运算 效率 。 

从 而 出 现 了 基于 十 进 制 的 线性 四 又 树 编码 。 
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3. 基于 十 进 制 的 线性 四 又 树 编 码 


这 种 编码 方法 的 建立 过 程 类 似 于 前 面 的 基于 四 进 制 的 线性 四 叉 树 编码 。 
图 7.8 的 线性 四 又 树 的 十 进 制 编码 如 图 7.10(a) 所 示 , 经 自 下 而 上 归并 得 
图 7.10(b)。 





图 7.10 四 又 树 的 十 进 制 编码 


归并 时 ,首先 将 图 7.10(a) 中 码 进行 排序 ,依次 检查 四 个 相 邻 叶 结 点 的 属性 代 
码 是 否 相 同 , 若 相同 归 并 成 一 个 父 结 点 , 记 下 地 址 及 代码 ,否则 不 予 归 并 。 然 后 ,再 
归并 更 高 一 层 的 父 结 点 ,如 此 循环 ,直到 最 后 。 

同 基 于 四 进 制 的 线性 四 又 树 编 码 一 样 ,十进制 四 又 树 编 码 其 栅 格 阵列 的 行列 
号 之 间 可 方便 地 进行 转换 。 

已 知 顶 格 阵列 的 行列 号 转换 成 四 叉 树 的 十 进 制 码 的 方法 ,如 上 所 述 ,首先 将 栅 
格 阵列 的 行列 号 ,分 别 以 二 进 制 形式 表示 , 得 到 二 进 制 的 行 号 及 和 列 号 到 。 然 
后 ,分 别 将 二 进 制 的 行列 号 按 位 交错 排列 , 即 可 得 到 四 又 树叶 结 点 的 二 进 制 地 址 
码 , 进 而 将 二 进 制 码 转 成 十 进 制 码 得 四 又 树 的 十 进 制 编码 M。 

例如 , 求 图 7.10(a) 中 第 3(011) 行 ,第 2(010) 列 所 对 应 的 M 码 ,结果 如 图 
7.11 所 示 : 

列 号 =0 1.0 


胶 梧 是 葬 量 国 E。 


行 号 =0 1 1 
图 7.11 列 号 向 十 进 制 码 的 转换 


同样 ,已 知 十 进 制 M 码 ,可 将 其 转换 成 二 进 制 码 , 然 后 , 隔 位 抽取 便 可 得 到 相 
应 的 二 进 制 行 号 , 列 号 ,这 就 是 十 进 制 M 码 在 栅 格 阵列 中 所 处 的 行列 位 置 。 
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四 又 树 的 十 进 制 编码 不 仅 比 四 进 制 编码 节省 存储 空间 , 而 且 , 前 后 两 个 M 码 
之 间 差 即 代表 了 叶 结 点 的 大 小 ,从 而 还 可 进一步 利用 游程 编码 对 数据 进行 压缩 。 
图 7.10 所 示 栅 格 数据 的 线性 四 又 树 的 十 进 制 编码 可 归纳 成 图 7.12(a) ,并 进一步 
用 块 式 编码 (二 维 游程 长 度 编码 ) 如 图 7.12(b) 所 示 。 




















48 1 


49 0 








(b) 二 维 游程 码 表 
图 7.12 ”四 又 树 游程 编码 


7.3.4 2Z 曲 线 和 Hibert 曲线 算法 


因为 在 空间 数据 所 处 的 多 维 空间 中 根本 没有 天 然 的 顺序 ,所 以 为 了 在 一 维 存 
储 设备 上 实现 高 效 的 空间 数据 存储 和 查询 ,需要 一 个 从 高 维 空间 向 一 维 空间 的 映 
射 。 该 映射 是 距离 不 变 的 ,这 样 空 间 上 邻近 的 元 素 映 射 为 直线 上 接近 的 点 ,而 且 一 
一 对 应 , 即 空间 上 不 会 有 两 个 点 映射 到 直线 的 同一 个 点 上 。 为 达到 这 一 目标 ,提出 
了 许多 映射 方法 (它们 都 不 能 完全 理想 地 满足 这 一 目标 )。 最 突出 的 方法 包括 Z 
曲线 、 格 雷 码 和 Hibert 曲线 。 

空间 填充 曲线 是 利用 一 个 线性 顺序 来 填充 空间 ,可 以 获得 以 下 从 一 端 到 另 一 
端的 曲线 ,如 图 7.13 所 示 。 , 

前 面 7.3.3 介绍 的 线性 四 叉 树 是 Z 曲线 生成 算法 中 的 典型 算法 ,以 基于 十 进 
制 的 线形 四 叉 树 编码 为 例 , 由 图 7.10 的 编码 结果 得 到 图 7.14。 

Hilbert 曲线 的 生成 算法 (图 7.15) 如 下 : 

(1) 读 和 人 xz 和 y 坐标 的 n 比特 二 进 制 表 示 。 
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图 7.13 生成 一 条 Z 曲线 


(2) 隔行 扫描 二 进 制 比特 到 一 个 字符 串 。 

(3) 将 字符 串 自 左 至 右 分 成 2bit 长 的 串 ;; ,其 
中 ii=1,:…,no 

(4) 规定 每 个 2bit 长 的 串 的 十 进 制 值 qd; ,例如 
“00” 等 于 0,“01” 等 于 1;“10” 等 于 3,“11” 等 于 2。 

(5) 对 于 数组 中 每 个 数字 j;, 如果 j=0, 则 把 
后 面 数组 中 出 现 的 所 有 1 变 成 3, 并 把 所 有 出 现 的 

ek 3 变 成 1; 如 果 ;=3, 则 把 后 面 数组 中 出 现 的 所 有 0 

图 7.14 基于 十 进 制 编码 。 变 成 2, 并 把 所 有 出 现 的 2 变 成 0。 
得 到 的 Z 曲线 (6) 将 数组 中 每 个 值 按 步 又 (5) 转 换 成 二 进 制 
表示 (2bit 长 的 串 ) , 自 左 至 右 连接 所 有 的 串 ,并 计 





算 其 十 进 制 值 。 

图 7.16 是 使 用 以 上 算法 进行 转换 的 一 个 例子 。 

比较 二 者 在 空间 数据 检索 上 的 效率 , Hilbert 曲线 的 方法 要 比 Z 曲线 好 一 些 ， 
因为 它 没 有 斜 线 。 不 过 ,Hilbert 曲线 算法 和 精确 人 口 点 及 出 口 点 的 计算 量 都 要 比 
Z 曲线 复杂 。 


第 7 章 空间 数据 索引 算法 。 15S7 . 














图 7.15 生成 一 条 Hilbert 曲线 





图 7.16 Hilbert 曲线 转换 的 例子 
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思 考题 


1. 编写 程序 实现 R* 树 结构 。 | : 
2. 编写 程序 实现 四 又 树 结构 ,以 及 常规 四 又 树 向 线形 四 又 树 的 转换 。 


第 8 半空 间 数据 内 桶 算法 


8.1 概 述 


空间 数据 内 插 可 以 分 为 几何 方法 、 统 计 方法 空间 统 计 方法 、 函 数 方法 、 随 机 模 
拟 方法 ,物理 模型 模拟 方法 和 综合 方法 。 每 一 种 方法 均 有 其 适用 范围 算法 和 优 负 
点 ,因此 ,没有 绝对 最 优 的 空间 内 插 方 法 ,必须 对 数据 进行 空间 探索 分 析 ,根据 数据 
的 特点 ,选择 最 优 方法 ;同时 ,应 对 内 插 结 果 进 行 严 格 的 检验 。 

根据 已 知 地 理 空 间 的 特性 探索 未 知 地 理 空间 的 特性 是 许多 地 理 研究 的 第 一 
步 ,也 是 地 理学 的 基本 问题 。 常 规 方法 无 法 对 空间 中 所 有 点 进行 观测 ,但 是 我 们 可 
以 获得 一 定数 量 的 空间 样本 。 这 些 样 本 反映 了 空间 分 布 的 全 部 或 部 分 特征 ,并 可 
以 据 此 预测 未 知 地 理 空间 的 特征 。 在 这 一 意义 上 ,空间 数据 内 插 可 以 被 定义 为 根 
据 已 知 的 空间 数据 估计 (预测 ) 未 知 空间 的 数据 值 。 其 目标 可 以 归纳 为 :中 缺 值 估 
计 。 估 计 某 一 点 缺失 的 观测 数据 ,以 提高 数据 密度 。 名 内 插 等 值 线 。 以 等 值 线 的 
形式 直观 地 显示 数据 的 空间 分 布 。@ 数 据 网 格 化 。 把 无 规则 分 布 的 空间 数据 内 播 
为 规则 分 布 的 空间 数据 集 ,如 规则 抢 形 格 网 三角 网 等 。 

空间 数据 内 插 的 分 类 有 多 种 依据 ,如 中 确定 或 随机 ;名 点 与 面 ;@@ 全 局 或 局 部 
等 标准 分 类 ;四 内 揪 方 法 的 基本 假设 和 数学 本 质 。 下 面 依据 内 揪 方 法 的 基本 假设 
和 数学 本 质 进 行 分 类 说 明 。 


8.1.1 几何 方法 
几何 方法 是 最 简单 的 空间 内 插 方 法 。 几 何方 法 基于 “地 理学 第 一 定律 "的 基本 
假设 , 即 邻 近 的 区 域 比 距离 远 的 区 域 更 相似 。 几 何方 法 的 优点 是 计算 开销 少 ,具有 
普 适 性 ,不 需要 根据 数据 的 特点 对 方法 加 以 调整 。 当 样本 数据 的 密度 足够 大 时 , 几 
何方 法 一 般 能 达到 满意 的 精度 。 几 何方 法 的 最 大 问题 是 无 法 对 误差 进行 理论 估 
计 。 最 常用 的 几何 方法 有 泰 森 多 边 形 ( 最 近 距 离 法 ) 和 反 距 离 加 权 方 法 。 
8.1.2 统计 方法 z 


统计 方法 的 基本 假设 是 一 系列 空间 数据 相互 相关 ,预测 值 的 趋势 和 周期 是 与 
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它 相关 的 其 他 变量 的 函数 。 统 计 方法 的 优点 是 计算 开销 不 大 ,有 一 定 的 理论 基础 ， 
能 够 对 误差 作出 整体 上 的 估计 。 但 是 ,其 前 提 是 一 定 要 有 好 的 采样 设计 。 如 果 采 
样 过 程 不 能 反映 出 表面 变化 的 重要 因素 ,如 周期 性 和 趋势 , 则 内 插 一 定 不 能 取得 好 
的 效果 。 常 用 的 统计 方法 有 趋势 面 方法 和 多 元 回归 方法 。 


8.1.3 空间 统计 方法 


空间 统计 又 称 地 质 统 计 学 ,于 20 世纪 50 年 代 初 开始 形成 ,60 年 代 在 法 国 统 
计 学 家 Matheron 的 大 量 理论 研究 工作 基础 上 逐渐 趋 于 成 熟 。 其 基本 假设 是 建立 
在 空间 相关 的 先 验 模型 之 上 的 。 假 定 空 间 随 机 变量 具有 二 阶 平稳 性 ,或 者 是 服从 
空间 统计 的 本 征 假设 。 则 它 具 有 这 样 的 性 质 : 距 离 较 近 的 采样 点 比 距离 远 的 采样 
点 更 相似 ,相似 的 程度 或 空间 协 方差 的 大 小 ,是 通过 点 对 的 平均 方差 度量 的 。 点 对 
差异 的 方差 大 小 只 与 采样 点 间 的 距离 有 关 , 而 与 它们 的 绝对 位 置 无 关 。 空 间 统 计 
内 插 的 最 大 优点 是 以 空间 统计 学 作为 其 坚实 的 理论 基础 ,可 以 克服 内 插 中 误差 难 
以 分 析 的 问题 , 能够 对 误差 作出 逐 点 的 理论 估计 ; 它 也 不 会 产生 回归 分 析 的 边界 
效应 。 其 缺点 是 复杂 ,计算 量 大 ,尤其 是 变异 函数 是 几 个 标准 变异 函数 模型 的 组 合 
时 ,计算 量 很 大 ; 另 一 个 缺点 是 变异 函数 需要 根据 经 验 人 为 选 定 。 空 间 统计 方法 以 
克 里 金 (Kriging) 法 及 其 各 种 变种 为 代表 。 


8.1.4 函数 方法 


函数 方法 是 使 用 函数 逼近 曲面 的 一 种 方法 。 函 数 方法 在 空间 内 播 领域 大 多 用 
于 一 些 特殊 场合 ,如 利用 高 密度 的 高 程 数 据 产 生 等 高 线 ,为 提高 格 网 数据 的 空间 分 
辩 率 而 内 择 数 据 等 。 对 于 利用 有 限 的 观测 数据 进行 缺 值 预测 和 内 播 格 网 , 函数 方 
法 多 不 适合 ,因为 它 难以 满足 内 捅 的 精度 ,也 难以 估计 误差 。 函 数 方法 的 特点 是 不 
需要 对 空间 结构 的 预先 估计 ,不 需要 做 统计 假设 。 其 缺点 是 难以 对 误差 进行 估计 ， 
点 稀 时 效果 不 好 。 常 用 的 函数 方法 有 : 健 里 叶 级 数 、 样 条 函数 、 双 线性 内 插 、 立 方 卷 
积 法 等 。 


8.1.5 随机 模拟 方法 


随机 模拟 方法 的 基本 假设 与 空间 统计 方法 不 同 ,随机 模拟 认为 地 理 空间 具有 
非 平稳 性 ,是 空间 异 质 的 。 它 通过 空间 分 布 现 象 的 可 选 的 、 等 概 的 .数值 表达 (地 
图 ) 来 对 空间 不 确定 性 建 模 。 对 应 不 确定 性 ,可 以 接受 可 选 的 多 个 管 案 。 与 空间 统 
计 方 法 不 同 ,随机 模拟 方法 不 是 产生 唯一 的 估计 结果 , 它 产生 一 系列 可 选 的 结果 ， 
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它们 都 与 实际 数据 一 致 , 而且 相关 模型 将 它们 联系 起 来 。 随 机 模拟 方法 的 最 大 优 
点 是 定义 了 各 种 随机 变量 之 间 的 空间 相关 ,这 类 相关 可 以 根据 相 邻 数据 把 高 度 不 
确定 性 的 先 验 分 布 更 新 为 低 不 确定 性 的 后 验 分 布 。 其 缺点 是 建 模 困难 ,计算 量 大 。 
常用 的 随机 模拟 方法 有 高 斯 过 程 、 马 尔 科 夫 过 程 、 蒙 特 卡 罗 方 法 、 人 工 神经 网 络 方 
法 等 。 


8.1.6 确定 性 模拟 


确定 性 模拟 的 基本 假设 是 变量 的 空间 分 布 受 物理 定律 控制 。 因 此 ,可 以 使 用 
物理 模型 或 半 经 验 、 半 物理 的 模型 模拟 空间 分 布 。 对 于 这 一 类 内 插 , 往 往 是 使 用 有 
限 的 观测 值 获得 一 些 必需 的 经 验 参 数 ,再 把 这 些 参 数 代 人 到 物理 模型 之 中 。 典 型 
汐 闭 子 是 ,GCM 是 一 个 纯 物理 模型 ,但 它 的 参数 化 使 用 了 经 验方 法 。 在 山区 气候 
变量 的 内 插 过 程 中 ,也 大 量 使 用 这 种 方法 。 确 定性 模拟 的 最 大 优点 即 它 的 确定 性 ， 
它 不 依赖 或 很 少 依赖 观测 样本 。 但 空间 现象 是 否 可 以 被 确定 性 地 预测 以 及 我 们 是 
否 可 以 持 这 一 乐观 的 信念 十 分 值得 怀疑 。 


8.1.7 综合 方法 


综合 方法 是 以 上 几 种 方法 的 综合 。 对 于 空间 变量 ,一般 能 够 用 不 同 的 方法 分 
别 对 结构 化 变量 、 随 机 变量 和 观测 误差 ( 残 差 ) 建 模 。 综 合 方法 还 适宜 于 能 够 得 到 
辅助 性 数据 ,如 遥感 数据 的 场合 。 通 过 从 辅助 性 数据 中 提取 空间 模式 ,在 合理 的 数 
据 结 构 , 如 四 叉 树 的 支持 下 ,划分 空间 同 质 的 区 域 , 从 而 到 近 最 佳 的 预测 值 。 

下 面 就 常见 的 空间 数据 内 插 方法 作 一 介绍 。 


8.2 分 段 圆 弧 法 


已 知 两 点 Pp, (Zi, yi )， 下 ;和 (zi+l， 
Vi+1) 及 其 切线 方向 : 





k; = tanO; (8 1) 
ki+1 = tang0 1 SS 1 
可 作 两 相 切 之 圆 弧 分 别 过 P; 与 ~ i 


P;+41, 且 在 Pi、P;i1 之 切线 方向 分 别 为 &; 
与 41, 两 圆 弧 相 切 于 P, 如 图 8.1 所 示 。 


利用 上 述 条 件 ,一 般 可 解 得 多 对 满足 条 件 
图 8.1 分 段 圆 弧 内 插 
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的 圆 弧 ,但 在 一 定 假设 条 件 限制 下 ,可 得 到 唯一 解 。 
若 假设 P; Pi 1 与 O1O02 互相 垂直 (Oi 与 OO; 分 别 为 两 圆 弧 的 圆心 ), P， Pi+1 
的 方向 角 为 a: 








tana = (yi+1™ Yi) /A(zi+1™ Xi) (8.2) 
令 
Aail=|a-0|=AP;OP 
Aas= |a— Or1l = APi+102P (8.3) 
由 条 件 
卫 ; Pi+1= risinAa!l + r2sinAay 
ri ricosAa1= 72 ~ r2cosAa2 (8.4) 
并 令 
d=PiPi+1=V (zi+1— zi) + (yi+1— y;)” (8.5) 
可 解 得 
=ad/ (sinAar + Tt sinhaa| 
re (8.6) 


进而 可 解 算 Oi 与 0; 的 坐标 以 及 OiP; 与 OP, ,1 的 方位 角 。 
8.3 ”分 段 三 次 多 项 式 插值 法 
8.3.1 三 点 法 


假定 某 一 点 Pi(zi ,yw) 上 的 切线 垂直 于 该 节点 相对 于 相 邻 两 点 Pi-1 (zi-1， 
Yi-1) 与 PCzirty+ri) 张 角 的 角 平分 线 , 即 点 P; 处 的 切线 方向 角 为 
0 = 之 于 二 arctan 人 十 arctan 
2 2 Tit+1™ Ti Ti Ti~l1 
另 一 种 三 点 法 确定 切线 方向 的 方法 是 假定 点 Pi(zi,y) 处 的 切线 方向 等 于 其 
相 邻 两 点 Pp, 1(T -1-1) 与 Pjy1(Xi+1,yi+1) 确 定 的 方向 , 即 
tang,; Sl (8.8) 


Xi+1 Xi-l 


yi Yi-1 








(8.7) 


8.3.2 五 点 法 (Akima 法 ) 


Akima 法 由 相 邻 的 5 个 点 Pk (zk,yk)(K=i-2,i 一 1,i,i+1,i+2) 解 算 曲 
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线 在 Pi 点 的 斜率 tan0; , 它 是 点 已 为 端点 的 两 弦 斜 率 的 加 权 平 均值 ,其 权 P, 与 PP 
分 别 等 于 已 点 前 两 弦 斜 率 差 的 绝对 值 与 后 两 弦 斜 率 差 的 绝对 值 : 




















Vi-1™ Yi Vi Yi-1 
Ptan ~ :+ P,tan 
+1 Xi XTi-1 
tan0; = 8.9 
a (8.9) 
其 中 
Yi Yi-l Vi-1™ Yi-2 
P,= |tan 一 ta 
ii-1 Ti-1™ Xi-2 
(8.10) 
yi+2 VMi+l yi+l Yi 
P,= |tan 
ii+2 Xi+l Tit!1 Xi 








由 训练 有 素 的 绘图 员 在 数据 点 间 内 插 出 一 组 曲线 ,通过 不 同 的 内 插 方 法 与 这 
组 曲线 进行 比较 ,Akima 法 最 接近 于 徒手 绘制 的 曲线 。 当 至 少 有 3 个 数据 点 处 在 
同一 条 直线 上 时 ,Akirna 法 内 插 出 一 条 直线 段 ,而 其 他 非 线性 内 插 法 却 没有 这 种 
特性 。 其 缺点 是 在 节点 处 曲线 的 二 阶 导数 不 能 保证 连续 。 


8.4 趋势 面 插值 算法 


多 项 式 回 归 分 析 是 描述 长 距离 渐变 特征 的 最 简单 方法 。 多 项 式 回归 的 基本 思 
想 是 用 多 项 式 表示 的 线 或 面 按 最 小 二 乘法 原理 对 数据 点 进行 拟 合 , 线 或 面 多 项 式 
的 选择 取决 于 数据 是 一 维 还 是 二 维 。 

地 理 特征 z 是 xz 的 线性 函数 :表达 式 z = bo + b1x。 其 中 ,bo、61 为 多 项 式 系 
数 (图 8.2)。 





图 8.2 zx 距离 内 特征 z 的 最 佳 匹配 线性 回归 线 
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许多 情况 下 z 不 是 z 的 线性 函数 ,而 是 以 更 为 复杂 的 方式 变化 ,在 这 种 情况 
下 需 用 二 次 或 更 高 次 的 多 项 式 : z = bo + bi1x + 6b2x? +… 来 拟 合 更 复杂 的 曲线 
(图 8.3)。 





图 8.3 高 次 多 项 式 
一 次 趋势 面 的 数学 模型 (二 维 ): 
z=botb1rzt by (8.11) 
二 次 趋势 面 的 数学 模型 (二 维 )， 
z=botbizt+boyt+ ba3r + baryt+ bsy’ (8.12) 


三 次 趋势 面 的 数学 模型 (二 维 ): 
z=bo0tbIz+bryt boar +baryt bsy +bers+brr yt+ bery + boy’ 
(8.13) 

趋势 面 分 析 的 优点 是 : 它 是 一 种 极 易 理解 的 技术 ,至 少 在 计算 方法 上 是 易于 理 
解 的 。 另 外 ,大 多 数 数据 特征 可 以 用 低 次 多 项 式 来 模拟 。 

趋势 面 拟 合 程度 的 检验 , 同 多 元 回归 分 析 一 样 可 用 下 分 布 进行 检验 ,其 检验 
统计 量 为 
U/P 
Q/(n-p-1) 
式 中 ,U 为 回归 平方 和 ; Q 为 残 差 平方 和 (剩余 平方 和 );P 为 多 项 式 的 项 数 ( 但 不 
包括 常数 项 5b0);n 为 使 用 资料 的 数目。 当下 >>F, 时 , 则 趋势 面 拟 合 显著 ,否则 不 
显著 。 

举例 : 

图 8.4 显示 5 个 已 知 值 的 气象 站 点 ,围绕 着 未 知 数值 的 0 号 站 点 。 下 表 显 示 
各 个 点 的 zx、y 坐标 ,用 格 网 单元 大 小 为 2 000m 的 行 和 列 来 表示 ,它们 的 已 知 值 
是 2: 


F (8.14) 
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本 例 说 明 如 何 用 公式 (8.11) ,或 是 一 个 线性 趋势 面 来 对 未 知 值 的 0 号 站 点 进 
行 插值 。 最 小 二 乘法 通常 用 于 计算 公式 (8.11) 中 bo、b1 和 52 系数 。 因 此 ,第 一 步 
是 建立 如 下 3 个 法 方程 ,与 回归 分 析 的 方程 相似 。 


>)z= bon + biD r+t+b Dy 
DP xz= bo r+ 62 r+ 6b22) xy 


2 R= bo y+ 60612 zy + br2)y 
以 上 方程 可 以 改写 成 矩阵 形式 : 
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Dx 2 Dxy . | > zz 

2 


用 5 个 已 知 点 的 值 ,我 们 能 计算 出 统计 值 并 将 代入 方程 : 


Dy Dry Dy 
4 377 318 | bo 一 10.094 
377 29007 23 862| .|211 = 0.020 
b 0.347 

















18 23862 20 714) 


将 左边 的 第 一 个 逆 矩 阵 与 右边 的 矩阵 相 乘 ,我们 能 算出 系数 6: 
Er -0.163 —0.168) ce | 





-0.163 0.002 0.000|. |5034.650|= | 0.020 

-0.168 0.000 0.002| L4445.800 0.347 
0 号 站 点 的 未 知 值 可 用 这 些 系数 由 下 式 估 算 : 

po= —10.094+(0.020)(69) + (0.347)(67) =14.669 


8.5 反 距 离 权 重 插值 算法 


反 距离 权重 插值 方法 是 一 种 局 部 插值 方法 , 它 假 设 未 知 值 的 点 受 较 近 控 制 点 
的 影响 比较 远 控制 点 的 影响 更 大 。 这 种 方法 通常 用 在 计算 机 辅助 制图 方面 。 影 响 
的 程度 (或 权重 ) 用 点 之 间距 离 乘 方 的 倒数 表示 。 乘 方 为 1.0 意味 着 点 之 间 数 值 变 
化 率 为 恒定 ,该 方法 称 为 线性 插值 法 。 乘 方 为 2.0 或 更 高 则 意味 着 越 靠近 已 知 点 ， 
数值 的 变化 率 越 大 ,远离 已 知 点 趋 于 平稳 。 反 距离 权重 方法 的 通 几 方程 是 


> St 
i=1 


wT (8.15) 


式 中 ,zo 为 点 0 的 估计 值 ;z; 为 控制 点 i 的 z 值 ;d; 为 控制 点 i 与 点 0 间 的 纪 离 ;5 
为 在 估算 中 用 到 的 控制 点 的 数 日 :K 为 指定 的 宕 。 


8.6” 双 线性 插值 算法 


双 线 性 插值 算法 是 一 种 数字 图 像 处 理 .DEM 数据 处 理 等 方面 使 用 比较 多 的 局 
部 插值 方法 。 
如 图 8.5 所 示 , 设 f(0,0)= zi,f(1,0)= zz,f(0,1)=z3,f(1,1)= xz4, 求 
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f(z,y) 点 的 值 ,其 中 x,yE[0,1]。 将 了 (0,0)、f(1,0)、f(0,1)、f(1,1) 代 入 双 线 
性 内 插 方程 : 
f(xz,y)=artbytcrytad (8.16) 
求 出 各 参数 a、5b、c .qd 的 值 ,再 将 x 、y 代入 , 解 得 AFLz,y)。 





图 8.5 双 线 性 插值 


在 数字 图 像 处 理 中 ,对 于 求解 一 个 目的 像素 的 值 ,设置 坐标 通过 反 向 变换 得 到 
的 浮 点 坐标 为 (i + xj +), 其 中 ,i、j 均 为 非 负 整数 ,wu、wv 为 [0,1) 区 间 的 浮 点 
数 , 则 这 个 像素 的 值 Fi + xj + wv) 可 由 原 图 像 中 坐标 为 (i,j)、(i+1,j)、(i,j++ 
1)、(i+1,j+1) 所 对 应 的 周围 四 个 像素 的 值 决定 , 即 
flit+usj+v)= (1 wl -vfi,I) + (lu)vf(i,; + 1) 
+ ull— wv)f (it1,;)+ uvf(it+l1,;7+1) (8.17) 
式 中 ,f(i,j) 为 原 图 像 (i,j) 处 的 像素 值 。 


8.7 薄板 样 条 函数 法 

8.7.1 薄板 样 条 函数 法 
除了 在 空间 插值 中 是 应 用 于 面 而 非 线 以 外 ,空间 插值 样 条 函数 与 直线 推广 样 
条 函数 在 概念 上 是 相似 的 。 菏 板 样 条 函数 建立 一 个 通过 控制 点 的 面 , 并 使 所 有 点 
的 坡度 变化 最 小 。 换 言 之 ,薄板 样 条 函数 以 最 小 曲率 面 拟 合 控制 点 。 薄 板 样 条 函 


数 的 估计 值 由 下 式 计 算 ; 
Q(z,y) = > Ad?logd; +a+pr+cy (8.18) 


。 168 . 地 理 信 息 系 统 算法 基础 





式 中 ,x 和 y 为 要 被 插值 的 点 的 x 、y 坐标 ;qd? = (x 一 zi)2+(y 一);x; 和 ;分别 
为 控制 点 i 的 x、y 坐标 。 薄 板 样 条 函数 包括 两 个 部 分 :(a + bx + cy) 表 示 局 部 趋 
势 函数 , 它 与 线性 或 一 阶 趋势 面具 有 相同 的 形式 ,dilogd; 表示 基本 函数 ,可 获得 最 
小 曲率 的 面 。 相 关系 数 A; ,a 、b 和 c 由 以 下 线性 方程 组 决定 


D3 Ad?logd;: ta+bricy= ff 
i=1 


> A =0 
(8.19) 
2 Axi =0 
> 4w -0 


式 中 ,nn 为 控制 点 的 数目 ; 为 控制 点 i 的 已 知 值 ;系数 的 计算 要 求 n +3 个 联 立 
方程 。 

其 他 算法 也 可 用 于 建立 最 小 曲率 的 面 ,例如 ,在 上 述 方 程 中 不 用 基本 函数 
d*logd ,而 用 双 调 和 格林 函数 d?(logd 一 1)。 

薄板 样 条 函数 的 一 个 主要 问题 是 在 数据 贫乏 地 区 的 坡度 较 大 ,经 常 涉 及 如 同 
过 伸 的 情况 。 各 种 用 于 订正 过 伸 的 方法 已 被 提出 ,包括 薄板 张力 样 条 、 规 则 样 条 和 
规则 张力 样 条 等 。 


8.7.2 规则 样 条 函数 


规则 样 条 函数 的 近似 值 与 薄板 样 条 函数 有 相同 的 局 部 趋势 函数 ,但 是 基本 也 


数 取 不 同形 式 : 
(ol a (Ko(S)+etin(£))) (8.20) 


式 中 ,r 为 样 条 法 中 要 用 到 的 权重 ;d 为 待定 值 的 点 和 控制 点 i 间 的 距离 ;c 为 常数 
0.577 215; Ko(4d/r) 为 修正 的 零 次 贝 塞 耳 函数 。 它 可 由 一 个 多 项 式 方程 估计 。+ 
值 通常 被 设 为 0 一 0.5 之 间 , 因 为 更 大 的 值 会 导致 在 数据 贫乏 地 区 趋 于 过 他 - 


8.7.3 薄板 张力 样 条 法 


薄板 张力 样 条 法 有 如 下 表达 形式 : 
pe > AR(d,) (8.21) 
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式 中 ,a 为 趋势 函数 。 基 本 函数 RR(d ) 为 
-3(m(F)+ e+ Kodag)) (8.22) 
式 中 ,$$ 为 本 张力 法 要 用 到 的 权重 。 如 果 #$ 的 权重 被 设 为 接近 于 0, 则 用 张力 法 与 
基本 薄板 样 条 法 得 到 的 估计 值 相似 。 较 大 的 $ 值 降低 了 薄板 的 刚度 ,结果 插值 的 
值 域 使 得 插值 成 的 面 与 通过 控制 点 的 膜 状 形态 相似 。 
薄板 样 条 函数 及 其 变种 被 推荐 用 于 平滑 和 连续 的 面 ,如 高 程 面 或 水 位 面 。 样 
条 法 也 被 用 于 对 气候 数据 (如 平均 降水 量 ) 的 插值 。 


8.8 克 里 金 法 


克 里 金 法 (Kriging) 是 一 种 用 于 空间 插值 的 地 理 统计 方法 。 克 里 金 注 的 原理 
是 假设 某 种 属性 的 空间 变化 (如 一 个 矿 体内 品位 的 变化 ) 既 不 是 完全 随机 也 不 是 完 
全 确定 。 反 之 ,空间 变化 可 能 包括 三 种 影响 因素 :空间 相关 因素 ,代表 区 域 变量 的 
变化 ; 偏 移 或 结构 ,代表 趋势 ;还 有 随机 误差 。 偏 移出 现 与 否 和 对 区 域 变量 的 解释 
导致 了 用 于 空间 插值 的 不 同 克 里 金 法 的 出 现 。 


8.8.1 车 通 克 里 金 法 


假设 不 存在 偏 移 ,普通 克 里 金 法 关注 于 空间 相关 因素 。 衡 量 所 选 已 知 点 之 间 
空间 相关 程度 的 测度 是 半 方 差 ,由 下 式 计 算 : 


7(h) = (zz) zzi+ hh) (8.23) 


式 中 ,hh 为 已 知 点 之 间 的 距离 ,常用 于 作为 省 后 系数 ;n 为 被 h 分 开 的 成 对 样本 点 
的 数量 ; 为 属性 值 。 半 方差 随 着 h 的 增 大 而 增 大 。 

在 不 同 距 离 的 半 方 差 值 算 出 后 ,它们 被 绘 成 半 方 差 图 , > 轴 代表 偏差 , z 轴 代 
表 已 知 点 之 间 的 距离 (图 8.6 的 半 方 差 图 显示 沿 y 轴 的 半 方 差 和 沿 z 轴 的 距离 。) 
半 方 差 可 分 成 三 部 分 : 熔 核 , 值 域 和 基 台 。 熔 核 是 在 距离 为 0 处 的 半 方 差 ,代表 无 
关 的 空间 噪音 。 值 域 是 半 方 差 的 空间 相关 部 分 , 它 显示 半 方 差 随 着 距离 递增 。 超 
过 值 域 范围 , 半 方 差 趋 平 于 相对 恒定 值 。 达 到 恒定 的 半 方 差 称 为 基 台 。 

半 方 差 图 将 半 方 差 与 距离 关联 起 来 。 它 可 单独 用 作 空 间 相 关 的 测度 ,与 空间 
自 相关 相似 。 但 在 克 里 金 法 中 用 作 插 值 器 , 半 方 差 图 必须 与 数学 函数 或 模型 拟 合 ， 
如 高 斯 、 线 性 球面、 圆 形 和 指数 模型 (图 8.7)。 拟 合 的 半 方 差 图 便 可 用 于 估算 任 
何 给 定 距离 的 半 方 差 。 . 

普通 克 里 金 法 在 空间 插值 中 直接 使 用 拟 合 半 方 差 图 。 估 算 某 点 的 z 值 的 通 
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图 8.6 半 方 差 图 显示 沿 y 轴 的 半 方 差 和 沿 z 轴 的 距离 


We ee elie 


图 8.7 五 种 拟 合 半 方差 图 的 数学 模型 :高 斯 线形 \ 球 形 、 圆 形 、 指 数 


用 方程 是 


5 


z0 = 2) zrW, (8.24) 


式 中 ,zo 为 估计 值 ;z; 为 已 知 点 的 值 ; W; 为 与 每 个 已 知 点 关联 的 权重 ; s 为 用 于 
估算 的 已 知 点 的 数目 。 权 重 可 由 对 一 组 联 立 方程 的 求解 得 到 。 例 如 ,下 列 联 立方 
程 是 由 3 个 已 知 点 估算 1 个 未 知 点 的 值 所 必需 的 

WIi7(h1) + Woy(h12) + Wa3y (hi3) + A = 7Y(hio) 

WIi7y(h21) + Way(h22) + W37(h23) + A = 7Y(h20) 

WIiY(h31) + WaY(h3) + Wa37(h33) + A = 7Y(ha0) 

Wit+ W + W3+0=1.0 
式 中 ,y(h;) 为 已 知 点 i 和 7 间 的 半 方 差 ;yY(hio) 为 已 知 点 和 未 知 点 之 间 的 半 方 差 ， 
又 是 拉 格 朗 日 系数 , 它 的 加 入 是 为 了 确保 把 估算 误差 降 到 最 小 。 上 面 的 方程 可 改 
写成 矩阵 形式 


(8.25) 
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7Y(Aal) 7Y(h12) 7(h13) 1 Wi 7Y(hio) 
7(hz1) 7Y(h22) 7(hz3) 1 |W, _ 7Y(h20) (8.26) 
7Y (ha1) Y (ha2) 7Y(h33) 1 W; 7 (ha0) 
1 1 1 A 1 
将 左边 的 逆 和 矩阵 乘 以 右边 的 矩阵 ,可 解 得 权重 矢量 。 一 旦 知道 了 权重 ,方程 便 
可 用 于 估算 zo: 
zo= Zz1 Wi+ z2 Wo + zs Ws3 , (8.27) 
上 例 表明 ,在 克 里 金 法 中 用 的 权重 不 仅 包括 估算 点 和 已 知 点 之 间 的 半 方 差 , 而 
且 包 括 已 知 点 之 间 的 半 方 差 。 这 与 反 距 离 权 重 插值 法 不 同 ,后 者 只 用 适用 于 已 知 
点 和 估算 点 的 权重 。 克 里 金 法 和 其 他 局 部 方法 之 间 的 另 一 个 重要 区 别 是 : 克 里 金 
法 对 每 个 估算 点 产生 一 个 方差 测度 来 衡量 估算 值 的 可 靠 性 。 上 例 中 ,方差 可 由 下 
式 计算 . | 
s2= WIiy(hio) + WY(h20) + Wa37(h30) + A (8.28) 


8.8.2 通用 克 里 金 法 


通用 克 里 金 法 假设 除了 已 知 点 之 间 的 空间 关系 外 ,空间 变量 在 二 值 上 还 有 偏 
移 或 有 结构 因素 。 一 般 地 说 ,通用 克 里 金 法 具体 表现 为 一 个 趋势 。 例 如 ,在 克 里 金 
过 程 中 的 一 个 趋势 面 方程 。 这 里 列举 两 种 通用 克 里 金 法 。 

(1) 使 用 一 个 平面 ,定义 为 如 下 一 阶 多 项 式 : 


M = b1xi +t bo y: (8.29) 
式 中 ,IM 为 偏 移 ;z; 和 y; 分 别 为 已 知 点 i 的 zx 和 y 坐标 ;6b1 和 5; 为 要 估计 的 偏 移 
系数 。 
(2) 用 二 阶 曲面 , 它 被 定义 为 一 个 二 阶 多 项 式 : 
M= bx;+ byy; t+ b3r + baxiyit bsy? (8.30) 


在 多 项 式 方程 中 的 系数 b; 必须 按 权 重 估算 ,这 意味 着 通用 克 里 金 法 比 普通 克 
里 金 法 要 求 更 多 的 联 立方 程 用 于 估算 未 知 值 。 


思 考题 


1. 编写 五 点 法 多 项 式 插 值 法 程序 实现 折线 的 光滑 。 
2. 编写 反 距 离 权重 插值 算法 程序 实现 由 离散 高 程 点 构建 DEM。 


第 9 章 Delaunay 三 角 网 与 Voronoi 图 算法 


9.1 概 述 


Delaunay 三 角 网 与 Voronoi 图 是 两 个 被 普遍 接受 和 采用 的 分 析 研 究 区 域 离散 
数据 的 有 利 工具 。 在 地 学 领域 ,经 常 需要 处 理 大 量 分 布 于 地 域内 的 离散 数据 。 由 
于 这 些 数据 分 布 的 不 均匀 性 ,就 产生 了 一 个 如 何 合 理 有 效 地 使 用 这 些 宝贵 数据 的 
问题 。1908 年 ,G. Voronoi 首先 在 数学 上 限定 了 每 个 离散 点 数据 的 有 效 作用 范围 ， 
即 其 有 效 反 映 区 域 信息 的 范围 ,并 定义 了 二 维 平面 上 的 Voronoi 图 (简称 V 图 )。 
1911 年 ,A.H. Thiessen 应 用 V 图 进行 了 大 区 域内 的 平均 降水 量 研究 。1934 年 ， 
B.Delaunay 由 V 图 演化 出 了 更 易于 分 析 应 用 的 Delaunay 三 角 网 (简称 D 三 角 
网 )。 从 此 ,V 图 和 DD 三 角 网 则 成 了 被 普遍 接受 和 广泛 采用 的 分 析 研 究 区 域 离散 
数据 的 有 利 工具 。 

在 GIS 中 ,2.5 维 的 分 析 处 理由 DTM( 数 字 地 形 模型 ) 模 型 进行 。 DTM 主要 
由 规则 网 格 ( 栅 格 ) 与 不 规则 网 格 (TIN) 两 种 数据 格式 来 表示 ,而 以 后 者 更 为 重要 。 
TIN 是 表达 表面 的 一 种 有 效 方法 ,具有 高 效率 的 存储 ,数据 结构 简单 ,与 不 规则 的 
地 面 特征 和 谐 一 致 ,可 以 表示 线性 特征 和 释 加 任意 形状 的 区 域 边 界 ,易于 更 新 ,可 
适应 各 种 分 布 密度 的 数据 等 优点 。 栅 格 也 被 用 来 表面 建 模 ,但 TIN 在 表面 发 生 显 
著 变 化 处 体现 数据 密度 改变 方面 更 有 优势 。 一 般 地 ,在 表现 表面 的 时 候 ,表面 平缓 
的 地 区 只 要 求 少数 几 个 采样 点 ,而 在 那些 表面 相对 起 伏 的 地 区 则 需要 更 多 的 数据 

TIN 是 由 点 生成 的 ,每 个 点 具有 一 个 反映 高 程 值 的 连续 型 实数 值 。 当 然 ,也 
可 以 使 用 TIN 来 表示 其 他 类 型 的 表面 值 ,如 化 学 物质 的 浓度 、 地 下 水 位 或 降水 量 。 
TIN 是 根据 采样 数据 点 的 值 计算 出 来 的 ,表现 为 一 个 连续 的 三 维 的 表面 。TIN 是 
一 系列 非 重 秋 的 三 角形 或 面 ,这 些 三 角形 或 面 完 全 充填 一 个 区 域 。 因 为 三 角 网 表 
现 的 是 具有 矢量 要 素 ( 点 、 线 ` 面 ) 的 表面 ,它们 可 以 精确 地 模拟 具有 断 线 (break- 
line) 的 表面 中 的 不 连续 区 域 。 断 线 通 常 是 指 河流 、 山 消 和 公路 等 ,在 这 些 地 方 表面 
的 坡度 会 发 生 显著 的 变化 。 

由 于 TIN 本 身 的 这 些 特点 ,决定 了 它 在 现代 地 理科 学 与 计算 机 科学 中 的 不 可 
忽视 的 地 位 。 在 分 析 研 究 区 域 (二 维 ) 的 离散 数据 时 ,都 可 以 尝试 一 下 采用 Delau- 
nay 三 角 网 或 Voronoi 图 的 分 析 途 径 。 如 GIS 中 的 网 络 分 析 。 描 述 地 表 形 态 的 一 
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种 最 佳 方法 ,是 地 表 ( 地 貌 和 地 物 ) 数 字 化 表现 的 手段 和 分 析 工 具 。 当 然 , 它 的 应 用 
不 仅 适用 于 地 学 ,而 且 活跃 于 所 有 与 2.5 维 分 析 有 关 的 领域 ,而 且 还 将 活路 于 地 图 
信息 识别 领域 。 


9.2 ” Voronoi 图 


设 p1、p2 是 平面 上 两 点 ,L 是 线段 p1p; 的 垂直 平分 线 ,L 将 平面 分 成 两 部 分 
Lr 和 Lg ,位 于 Li 内 的 点 p, 具 有 特性 :4 (pi,pi1)<d(pi,p2), 其 中 4d(pi,pi;) 表 示 
pi 与 p; 之 间 的 欧 几 里 得 距离 ,i = 1,2。 这 意味 着 ,位 于 Li 内 的 点 比 平面 其 他 点 
更 接近 点 py, 换 句 话说 ,Lr 内 的 点 是 比 平面 上 其 他 点 更 接近 于 户 的 点 的 轨迹 , 记 
为 V(pi), 如 图 9.1 所 示 。 如 果 用 玉 (p1,p;) 表 示 半 平面 Li, 而 Lk=H(p2,p1)， 
则 有 V(p1)=H(pi,p2),V(p2)=H(p2,p1)。 

给 定 平面 上 个 点 的 点 集 S,S=|p1,p2,…… ,ps1 定义 V (pi)= [Hp 
pj;), 即 V(p;) 表 示 比 其 他 点 更 接近 p; 的 点 的 轨迹 是 n 一 1 个 半 平 面 的 交 , 它 是 一 
个 不 多 于 n -1 条 边 的 凸 多 边 形 域 , 称 为 关联 于 p; 的 Voronoi 多 边 形 或 关联 于 户 
的 Voronoi 域 。 图 9.2 中 表示 关联 于 pi 的 Voronoi 多 边 形 , 它 是 一 个 四 边 形 , 而 


n=6。 





B Pa . 
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Pe. 人 
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Pl Pb2 
图 9.1 V(p1)、V(pz) 的 图 示 图 9.2 n=6 时 的 一 种 V(pi) 


对 于 S 中 的 每 个 点 都 可 以 做 一 个 Voronoi 多 边 形 , 这 样 的 ”个 Voronoi 多 边 
形 组 成 的 图 称 为 Voronoi 图 , 记 为 Vor(S), 如 图 9.3 所 示 。 该 图 中 的 顶点 和 边 分 
别称 为 Voronoi 顶点 和 Voronoi 边 。 显 然 ,| S|=n 时 ,Ver(S) 划 分 平面 成 n 个 多 边 
形 域 ,每 个 多 边 形 域 V(p;) 包 含 S 中 的 一 个 点 而 且 只 包含 S 中 的 一 个 点 。Vor(S ) 
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的 边 是 S 中 某 点 对 的 垂直 平分 线 上 的 一 条 线段 或 者 半 直 线 , 从 而 为 该 点 对 所 在 的 
两 个 多 边 形 域 所 共有 。Vor(S) 中 有 的 多 边 形 域 是 无 界 的。 个 点 的 点 集 S 的 
Voronoi 图 至 多 有 2n -5 个 顶点 和 3n 一 6 条 边 。 





9.3 ”Voronoi 图 及 其 对 偶 图 


9.3 Delaunay 三 角形 


Delaunay 三 角 网 是 Voronoi 图 的 伴生 图 形 , 它 是 通过 连接 具有 公共 顶点 的 3 
个 Vor(S) 多 边 形 的 生长 中 心 而 生成 的 (Delaunay 三 角 网 和 Voronoi 图 的 关系 如 
图 9.3 所 示 ) ,这 个 公共 顶点 就 是 形成 的 Delaunay 三 角形 外 接 圆 的 圆心 。 

Delaunay 三 角 网 是 一 系列 相连 的 但 不 重合 的 三 角形 的 集合 ,而 且 这 些 三 角形 
的 外 接 圆 不 包含 这 个 面 域 的 其 他 任何 点 。 它 具有 两 个 特有 的 性 质 。 

(1) 保证 最 邻近 的 点 构成 三 角形 , 即 三 角形 的 边 长 之 和 尽量 最 小 ,是 每 个 De- 
launay 三 角形 的 外 接 圆 不 包含 面 内 的 其 他 任何 点 , 称 之 为 Delaunay 三 角 网 的 空 外 
接 圆 性 质 ,这 个 特征 已 经 作为 创建 Delaunay 三 角 网 的 一 项 判别 标准 ; 

(2) 它 的 另 一 个 性 质 最 大 最 小 角 性 质 : 在 由 点 集 V 中 所 能 形成 的 三 角 网 中 ， 
Delaunay 三 角 网 中 三 角形 的 最 小 内 角 尽 量 最 大 , 即 三 角形 尽量 接近 等 边 三 角形 。 


9.4 Voronoi 图 生成 算法 
9.4.1 半 平 面 的 交 


利用 等 式 V(pi) = [H(p, 力 ) 构 造 n 一 1 个 半 平面 的 交 ,得 到 点 的 
Voronoi 多 边 形 ,然后 逐 点 构造 各 点 的 Voronoi 多 边 形 便 得 到 S 的 Voronoi 疼 。 这 
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就 是 利用 半 平 面 的 交 求 Voronoi 图 的 算法 ,该 算法 的 时 间 复 杂 性 为 O(n?)。 
9.4.2 增 量 构造 方法 


假设 点 集 S = {pi1,p2,… ,pn1 ,并 设 已 经 构造 出 上 (kn) 个 点 的 Voronoi 图 
Vor( 1pi1,p2，,…, pr] ) ,再 增加 点 pi+1 之 后 ,要 求 构造 Voronoi 图 Vor( | pi, p2,…， 
pe, Pe+1| )o 若 pp+1 位 于 以 Voronoi 顶点 vw; 为 圆心 的 圆 内 , 即 C(wv;) 内 ,那么 Vor 
(pi, pz，…, pel ) 顶 点 不 一 定 是 Vor( | Pi1,P2，… ;Pr ,Ph+1|) 顶 点 。 如 图 9.4(a) 所 
示 , 图 中 有 =4, 凸 党 用 虚线 表示 , 实 线 为 Vor( | pl ,za ,ps 四 ,该 Voronoi 图 有 两 
个 Voronoi 顶点 vi 与 v2。 





图 9.4 构造 Voronoi 图 的 增 量 算法 [新 增 点 p 位 于 点 集 晤 壳 的 内 部 或 圆 C(w) 内 ] 


考虑 增加 的 点 p 在 圆 内 并 位 于 点 集 凸 壳 之 外 [图 9.4(a)] ,此 时 先 确定 p 的 位 
置 是 在 凸 壳 的 哪 条 边 之 右 侧 , 或 一 条 边 的 右 侧 、 一 条 边 的 左 侧 ( 设 凸 壳 顶 点 按 逆 时 
针 方 向 排列 ) ;然后 修改 相应 的 Voronoi 多 边 形 及 Voronoi 点 。 在 图 9.4(a) 中 ,点 p 
位 于 凸 沉 边 p4p1 的 右 侧 ,图 中 点 线 表示 Vor( 1p1,p2，…,p4,; P|) ,该 Voronoi 图 有 
3 个 Voronoi 点 vi、v 2 与 v'3。 显然,v'2 与 v'3 不 是 Vor({pi,pz,p3,p4|) 的 顶 
点 ;v2 是 Vor(| pi1,p2,pP3; pal) 的 顶点 ,但 不 是 Vor(|p1,p2,p3,p4|) 的 顶点 。 

假设 新 增加 的 点 p 位 于 点 集 曲 党 内 [图 9.4(b)], 此 时 应 先 确定 点 p 所 在 的 
Voronoi 多 边 形 域 , 点 p 位 于 点 ps 相关 的 Voronoi 多 边 形 内 。 然 后 修改 该 Voronoi 
多 边 形 的 边 与 顶点 ,图 9.4(b) 中 产生 4 个 新 的 Voronoi 点 v1、v2、v3 与 v4, 而 原 
来 的 Voronui 点 vi 与 wa 不 再 是 Voronoi 点 [图 9.4(a)]。 

考虑 新 增加 的 点 p 位 于 凸 壳 的 外 部 并 且 不 在 圆 C(wv) 内 ,其 中 wv 为 Voronoi 
点 ,如 图 9.5 所 示 。 此 时 分 两 种 情况 讨论 :中 点 p 位 于 上 同 沉 的 一 条 边 之 右 侧 , 如 
图 9.5(a) 所 示 。 图 中 点 p 在 p1p2 的 右 侧 ,修改 点 p 所 在 Voronoi 多 边 形 的 边界 ， 
得 到 点 线 所 示 的 新 增 Voronoi 多 边 形 ,并 且 vs 是 新 增加 的 Voronoi 点 。@ 点 p 位 
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(a) (b) 


图 9.5 构造 Voronoi 图 的 增 量 算法 [新 增 点 p 位 于 点 集 凸 沉 的 外 部 或 圆 C( wv) 的 外 部 ] 


于 凸 沉 的 两 条 边 的 右 侧 ,如 图 9.5(b) 所 示 。 图 中 点 p 在 p4p1 的 右 侧 及 p12 的 右 
侧 , 修 改 点 p 所 在 Voronoi 多 边 形 的 边界 ,得 到 点 线 所 示 的 新 增 Voronoi 多 边 形 ， 
并 且 v3、v4 是 新 增加 的 Voronoi 点 。 


1) 脱 机 增 量 算法 


输入 :点 集 S= |p1,p2,…, pn)。 

输出 :点 集 S 的 Voronoi 图 。 

步 1: 任 取 三 点 pi;、p;、pi ,并 连接 成 三 角形 pipjpi。 

步 2: 计 算 三 角形 ppjps 外 接 圆 圆心 及 半径 , 设 为 v 和 d。 

步 3: 计 算 距 离 4(p,,v)(65=1,n,b 隆 i ,j,k), 并 将 距离 由 小 到 大 分 类 , 设 相 
应 点 列 为 pi,p2,*…, pn-3,1*-1。 

步 4:if d(ps,v) 之 qd 则 进入 步 6, 否 则 进入 步 5。 | 

步 5: 改 取 三 点 pj、p;、pi 或 p;、pi、pi 或 p;、p;、pi, 并 连接 成 三 角形 ,或 有 多 个 
点 p1;p2，… ,pm 在 圆 C(v) 内 , 则 取 p1、ps、p3 连接 成 三 角形 。goto 步 2( 修 改 相 
应 的 下 标 )。 

步 6: 判 定 pi 在 已 有 出 壳 哪 条 边 之 右 侧 或 两 条 边 的 右 侧 ,如 图 9.5 所 示 。 

步 7: 修 改 pj 所 在 Voronoi 多 边 形 的 边界 及 顶点 。 

步 8;1<-1+1,goto 步 6, 直 到 />n 一 3。 

算法 中 步 8 至 步 6 的 每 次 循环 都 是 在 条 件 “p,i 之 不 在 圆 C(wv) 内 ”下 执行 的 ， 
其 中 v 是 已 求 得 的 Voronoi 点 。 

算法 中 步 1 与 步 2 只 需要 常数 时 间 , 步 3 要求 n -3 次 距离 计算 及 nlogn 次 比 
较 , 步 4 与 步 5 耗 费 常数 时 间 , 步 5 至 步 2 的 循环 为 常数 次 。 步 6 需要 a 次 判断 ,其 
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中 a 为 已 计算 子 点 集 呈 沉 的 边 数 ,每 次 判断 要 求 6 次 乘法 , 步 7 的 耗费 为 常数 , 步 8 
至 步 6 循环 n - 3 次 ,耗费 为 了 a = O(n?)。 因 此 ,算法 的 时 间 复杂 性 为 O(n?)。 


2) 联机 增 量 工法 


假设 点 集中 的 点 以 随机 方式 并 间隔 一 段 时 间 产 生 , 最 初 只 产生 一 个 点 p1, 间 
隔 At 时 间 后 产生 第 二 个 点 pz ,产生 ps 后 ,算法 立即 执行 , 求 出 两 个 点 的 Voronoi 
图 , 即 p1p; 的 中 垂 线 。 随 后 产生 第 三 个 点 p3, 算 法 求 三 个 点 的 Voronoi 图 Vor 
(|p1,p2,p3|), 依 此 类 推 。 要 求 算法 在 Az 时 间 内 能 完成 计算 增加 一 个 点 之 后 的 
Voronoi 图 的 工作 。 在 已 有 Vor(|pi, pz,…, psi|) 的 基础 上 ,随机 增加 点 psi 之 
后 ,为 了 计算 Vor( pi, 让 ,…, 如， pk+11), 首 先 要 判定 点 pa+1 位 于 Vor( pi, p2， 
…, 四) 中 哪个 Voronoi 多 边 形 域内 ,然后 修改 相应 Voronoi 多 边 形 的 边 与 顶点 即 
可 求 得 Vor( |p1,p2,*…, pi, pr+1l)o 

只 要 分 别 计算 pi +41 与 p1,p2,…, pi 的 距离 ,然后 求 其 最 小 距离 , 便 可 判定 点 
pr+1 落 入 哪个 Voronoi 多 边 形 域内 。 设 pi 41 位 于 与 p; 关联 的 Voronoi 多 边 形 域 
内 ,例如 图 9.4(a) 中 ,p 位 于 与 p; 关联 的 Voronoi 多 边 形 域内 并 且 p 在 凸 沉 内 ,该 
多 边 形 的 边 是 由 zz 分 别 与 p1、p3、psa 的 中 垂 线 组 成 。 修 改 与 ps 关联 的 Voronoi 
多 边 形 时 ,只 要 分 别 计算 p 与 pi、p2、p3, ps 的 中 垂 线 ,如 图 9.4(b) 所 示 。 如 果 zp 
不 在 凸 壳 内 ,如 图 9.4(b) 中 点 p, 此 时 p 位 于 与 pi 关联 的 Voronoi 多 边 形 域 内 ,该 
多 边 形 的 边 是 由 pi 分 别 与 p，、ps 的 中 垂 线 组 成 ,修改 与 pi 关联 的 Voronoi 多 边 
形 时 ,只 要 分 别 计算 p 与 p1、p2、ps 的 中 垂 线 ,不 必 计 算 p ps 的 中 垂 线 , 从 而 节 
省 了 计算 量 。 

构造 Voronoi 图 的 联机 增 量 算法 如 下 。 

步 1:while 产生 pi1, ps do 作 p1ip2 的 中 垂 线 , 输 出 Voronoi 图 为 中 垂 线 。 

步 2: while 产生 p3 do 连接 pl1、p2、p3 成 三 角形 , 作 三 边 中 垂 线 ,其 交点 为 
Voronoi 点 ,从 该 点 引出 的 三 条 中 垂 线 构成 Voronoi 图 。 

步 3:i<4。 

步 4: while 产生 p; do 判定 p; 落 入 哪个 Voronoi 多 边 形 域 内 ,修改 该 Voronoi 
多 边 形 及 相应 Voronoi 多 边 形 的 边 与 顶点 。 

步 5;i<-i 十 1,goto 步 4, 直 至 产生 点 的 工作 终止 。 

算法 中 步 1、 步 2 与 步 3 均 耗费 常数 时 间 。 利 用 分 别 计算 p; 至 pi1,p2，,… ,pi;-1 的 
距离 及 i - 2 次 比较 可 以 求 得 与 p; 最 近 的 点 ,例如 pj;, 从 而 判定 p; 落 入 与 p; 关联 
的 Voronoi 多 边 形 内 ,这 个 工作 需要 计算 i -1 次 距离 及 i 一 2 次 比较 ,修改 与 p; 关 
联 的 Voronoi 多 边 形 边 与 顶点 时 ,其 边 的 数目 决定 了 计算 复杂 性 ,n 个 点 的 Voronoi 
图 至 多 有 3n 一 6 条 边 和 2n 一 5 个 顶点 ,所 以 每 个 Voronoi 多 边 形 边 的 数目 为 一 常 
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数 ,因此 修改 Voronoi 多 边 形 边 与 顶点 耗费 常数 时 间 。 设 步 5 至 步 4 的 循环 次 数 为 n 


则 算法 时 间 复杂 性 为 >， (i—1) = O(n’)。 


第 i 次 执行 步 4， 需要 i+2 次 距离 计算 和 ;+1 次 比较 ,另外 还 要 修改 相应 的 
Voronoi 多 边 形 边 和 顶点 , 设 修改 工作 所 需要 的 时 间 为 C。 如 果 用 At; 表示 第 i 次 
执行 步 4 所 需要 的 时 间 , 那 么 At; = 计算 (i+2) 次 距离 的 时 间 + (i+1) 次 比较 的 
时 间 + C, 这 也 是 产生 点 p; ;3 后 ,要 间隔 Ar 时 间 再 产生 点 p14。 显然 ,该 间隔 时 
间 是 逐步 增加 的 。 


9.4.3 分 治 算法 


构造 Voronoi 图 的 分 治 算法 是 由 Shamos 和 Hoey 于 1975 年 提出 的 ,复杂 性 为 
O(nlogn)。 算 法 的 基本 思想 是 按 点 的 z 坐标 的 中 值 (或 先 按 点 的 二 坐标 分 类 , 然 


后 从 中 间 分 制 ) 分 割 点 集 S 为 S1 与 2, 使 1 Si| = 1 S| = 于 1S1。 如 果 S1、S 合 
点 数目 大 于 4, 则 继续 分 割 点 集 ,直至 子 点 集 规模 小 于 或 等 于 4, 对 每 个 小 子 点 集 利 
用 9.4.1 或 9.4.2 节 中 的 方法 求 Voronoi 图 ,然后 不 断 合并 相 邻 子 点 集 的 Voronoi 
图 ,直至 得 到 Vor(S)。 算 法 描述 如 下 : 

步 1: 划 分 S 为 规模 近似 相等 的 两 个 子 集 S1 和 S:。 

步 2: 递 归 地 构造 Vor(S1) 和 Vor( S,)。 

步 3; 构 造 折线 B, 分 开 S1 和 Ss, 并 使 4d(a,v)=4d(b,wv), 其 中 a€ Si1,6E 
S2,v 为 折线 上 的 点 。 

步 4: 删 去 位 于 B 左 侧 的 Vor(S;,) 的 所 有 边 及 位 于 B 右 侧 的 Vor( Si ) 的 所 有 
边 ,得 到 集合 S 的 Voronoi 图 Vor( S)。 

组 成 折线 B 的 每 条 线段 是 S; 和 Ss 中 某 两 点 连 线 的 垂直 平分 线 。 假 设 已 知 
CH(S1) 和 CH(S,), 在 线性 时 间 内 可 以 求 得 CH(S1) 和 CH(S;) 的 正切 线 。 设 
pi1pP2 为 所 求 的 正切 线 , p1€ S1, ps& Ss。 作 pi1p2 的 垂直 平分 线 。 设 想 由 上 向 下 沿 
该 垂直 平分 线 下 移 的 x 点 遇 到 Vor(S,) 或 者 Vor( Si ) 的 一 条 边 , 比如 遇 到 
Vor( S;) 的 一 条 边 , 如 图 9.6 所 示 。 图 中 点 py 和 p14 分 别 属于 Si = |p1, pz, 
psi 和 S,= { po, p10, . “, piel ,p14p7 的 向 下 垂直 平分 线 首 先 与 Vor( 5,) 的 边 相 交 ， 
即 与 pu p14 的 垂直 平分 线 相交 ,交点 为 g1, 留 下 折线 B 的 第 一 段 ( 半 直 线 )。 点 qi 
是 pi1pu4 的 垂直 平分 线 与 p14p7 的 垂直 平分 线 的 交点 ,因此 gi 是 三 角形 pi prpii 
的 外 接 圆 的 圆心 ,所 以 下 一 段 折线 为 如 加 1 的 垂直 平分 线 上 的 一 条 线段 ,此 时 寻找 
p7pri 的 垂直 平分 线 与 pz 关联 的 Voronoi 多 边 形 的 哪 条 边 相 交 , 图 中 示 出 pypui 的 
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图 9.6 构造 Voronoi 图 的 分 治 算法 





重 直 平分 线 与 p7pe 的 垂直 平分 线 相交 ,交点 为 92。g293 为 p11pe 的 垂直 平分 线 上 
的 一 条 线段 , 即 寻 找 p1 pe 的 垂直 平分 线 与 p11 关联 的 Voronoi 多 边 形 的 哪 条 边 相 
交 , 如 果 与 pi1 关 联 的 Voronoi 多 边 形 的 多 条 边 相交 , 则 以 比 qz 的 y 坐标 小 的 点 作 
为 B 的 下 一 个 顶点 93, 93 为 p11pe 的 垂直 平分 线 与 p11p10 的 垂直 平分 线 的 交点 。 





同 理 ,q3q4 为 pepio 的 垂直 平分 线 上 的 一 
条 线段 (q4 为 pepio 的 垂直 平分 线 与 peps 
的 垂直 平分 线 的 交点 ) ,gags 为 p10ps 的 重 
直 平分 线 上 的 一 条 线段 (q; 为 pspio 的 垂 
直 平 分 线 与 psps 的 垂直 平分 线 的 交点 )， 
qsg6 为 p10p8 的 垂直 平分 线 上 的 一 条 线段 
(g6 为 piops 的 垂直 平分 线 与 piop12 的 垂 
直 平 分 线 的 交点 ), q6q7 为 pspt2 的 垂直 平 
分 线 上 的 一 条 线段 (97 为 p12ps 的 垂直 平 
分 线 与 pi2p9 的 垂直 平分 线 的 交点 ), 9798 
为 pspo 的 垂直 平分 线 上 的 一 条 线段 (9g8 
为 pp 的 垂直 平分 线 与 psp4 的 垂直 平分 
线 的 交点 ), gs 向 下 的 射线 是 pop4 的 垂直 
平分 线 上 的 一 条 射线 。 折 线 B 的 构造 过 
程 如 图 9.7 所 示 。 

总 之 ,该 过 程 可 以 看 成 是 三 角形 序列 








图 9.7 构造 折线 B 的 过 程 
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的 演变 过 程 ,也 就 是 piap7pn 阅 p7pupe 六 pupepio 阅 pepiops 阅 pspiopsapiops 
P12 说 P12pgp9 站 pspop4, 称 为 三 角形 顶点 转移 法 。 

设 Si1= |al,a2,…,ak|,，S2 = 1651,62，,… be) ,并 假设 已 求 得 CH(S1) 和 CH 
(Sz)。 构 造 折线 B 的 算法 如 下 : 

步 1: 计 算 CH(S1) 和 CH(S;) 的 正切 线 , 设 为 及 Pi 和 PoPr ,ps 的 y 坐标 大 
于 ps 的 y 坐标 ,ps 的 y 坐标 大 于 加 的 y 坐标 。 

步 2: 作 pps 的 垂直 平分 线 oo， Lab 与 po( 或 Da) 关联 的 Voronoi 多 边 形 边 
(Ze. Bo. 的 垂直 平分 线 或 5 Po- 的 垂直 平分 线 ) 相 交 。 如 果 有 多 个 交点 , 则 取 y 坐标 
值 最 大 的 点 为 B 的 第 一 个 顶点 gi; 否则 ,交点 为 B 的 新 顶点 。 

步 3: 用 三 角形 顶点 转移 法 选择 新 的 三 角形 ,并 用 步 2 的 方法 计算 B 的 新 顶 
点 ,直至 作出 -7 的 重 直 平分 线 。 

执行 步 2 时 需要 确定 1 。 ,与 ps 关联 的 Voronoi 多 边 形 边 的 哪 条 边 相 交 , 这 
只 要 判断 该 Voronoi 多 边 形 的 端点 对 是 否 位 于 1, 的 两 侧 即 可 ,如 果 位 于 两 侧 , 则 
相交 ;否则 ,不 相交 。 如 果 相交 , 则 求 出 交点 ,得 到 B 的 一 个 新 顶点 。 

步 1 需要 线性 时 间 。 折 线 B 穿 过 Vor( Si1) 和 Vor(S;,) 时 ,组 成 B 的 线段 数目 
不 超过 | S1| + 1Ss| = n。 求 每 条 线段 只 需 常数 时 间 , 所 以 构造 B 仅 用 线性 时 间 。 
设 T(x ) 表 示 用 分 治 法 构造 x 个 点 的 点 集 S 的 Voronoi 图 所 需要 的 时 间 , 则 T(xn) 
满足 下 述 递归 关系 式 





T(x)=2T| 扫 )+ On) 


式 中 ,O(n ) 为 合并 Vor( Si1) 和 Vor(S,) 所 需要 的 时 间 。 该 递归 关系 式 的 解 为 
T(n)=O(nlogn )。 


9.4.4 减 量 算法 


已 知 点 集 S = 和 pi1, pz2，… pn] 的 Voronoi 图 , 现 删 去 点 p; 之 后 ,要 求 构造 
Voronoi 图 Vor( {pi1, pa pi 1 Piti,"", Pr})o 

如 果 p;-1、p;、pi+1 是 BCH(S) 上 的 连续 顶点 , 则 删 去 点 p; 及 p; 关联 的 
Voronoi 多 边 形 的 边 和 顶点 。 之 后 ,如 果 p;-1 与 pi;+1 成 为 BCH(S - | 广 上 上 相 邻 
顶点 ,并 设 p; 关联 的 Voronoi 多 边 形 的 边 为 el ez,，…et ,这些 边 分 别 是 p; 与 方 ， 
pi 与 方 +1 » Di 与 p;+ 4 的 垂直 平分 线 , 那 么 作 p;-1p;+1 的 垂直 平分 线 并 有 旦 修改 点 
Pi-1;Pi) Pj+1 ,Dj+k， Pit+1 关 联 的 Voronoi 多 边 形 的 边 和 顶点 , 便 可 求 得 Vor 
(pi1,p2,… ,pi-1;Pit1…, prnl)。 图 9.8(a) 中 删 去 点 ps 及 ps 关联 的 Voronoi 
多 边 形 的 边 和 顶点 ,之 后 ,点 加 与 pi 成 为 BCH( pi1, pz,p3,p4|) 上 相 邻 的 顶点 ， 
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点 ps 关联 的 Voronoi 多 边 形 的 边 分 别 是 ps 与 p1、ps 与 pp、ps 与 p4 的 垂直 平分 
线 , 作 p1p4 的 垂直 平分 线 ,并 且 修 改 点 pa, pi1, pz 关联 的 Voronoi 多 边 形 的 边 和 项 
点 ,最 后 以 点 线 表示 Vor( | pi1,p2,p3,p4))o 





图 9.8 构造 Voronoi 图 的 减 量 算法 


如 果 删 去 点 p; 之 后 , 方 -1 与 pi+1 不 是 BCH(S -1p;|) 上 相 邻 顶点 ,如 图 9.5 
(b) 所 示 ,那么 只 要 删 去 点 p;( 图 9.5(b) 中 点 如) 及 记 关联 的 Voronoi 多 边 形 的 边 
和 顶点 ,并 修改 BCH(S -|p;|) 上 新 顶点 关联 的 Voronoi 多 边 形 的 边 和 顶点 , 便 可 
得 到 Vor(| pi1, pz，… ,pi-1, Pit+1， ,pn1)。 图 9.5(b), 删 去 点 p 之 后 ,点 pi 是 
BCH(S 一 pl) 上 新 顶点 ,点 线 为 删 去 的 点 p 关联 的 Voronoi 多 边 形 边 ,虚线 为 
Vor( {pi1, Pp2, p3, p4|)o 

考虑 删 去 的 点 p; 在 凸 壳 内 部 ,如 图 9.8(b) 中 的 点 ps, 此 时 删 去 点 ps 关联 的 
Voronoi 多 边 形 边 和 顶点 ,并 修改 点 pi1, p2, p3, Pp4 关联 的 Voronoi 多 边 形 边 和 项 
点 ,因为 这 些 Voronoi 多 边 形 与 ps 关联 的 Voronoi 多 边 形 有 共同 的 边 。 

构造 点 集 S 的 Voronoi 图 的 减 量 算法 如 下 。 

步 1:ift p;-1, pi, pi+1 是 BCH(S) 上 连续 的 三 个 顶点 人 pi;-1 与 pi+1 是 BCH 
(S 一 1p;|) 上 相 邻 顶点 人 p; 关联 的 Voronoi 多 边 形 边 e; , e; ,… ,ei; 分 别 是 pi 与 
pj;, Pi 与 p+1,*,p; 与 p14 的 垂直 平分 线 。 

then 删 去 点 p; 及 p; 关联 的 Voronoi 多 边 形 边 和 顶点 , 作 p;-1pi;+1 的 垂直 平分 
线 并 修改 点 pi;-1, 广 ， 方 +1 Pith Di+ 1 关联 的 Voronoi 多 边 形 的 边 和 顶点 。 

else if p;_1, pe ,pi+1 是 BCH(S 一 1p;|) 上 连续 的 三 个 顶点 。 

then 删 去 点 p; 及 p; 关联 的 Voronoi 多 边 形 的 边 和 顶点 ,并 修改 点 pi 关联 的 
Voronoi 多 边 形 的 边 和 顶点 。 

步 2: if p; 在 CH(S) 内 部 人 p; 关联 的 Voronoi 多 边 形 边 分 别 是 p; 与 p; ,pi 与 
pi+1»'", Pi 与 p;+4 的 垂直 平分 线 。 
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then 删 去 点 p; 及 p; 关联 的 Voronoi 多 边 形 边 和 顶点 ,并 修改 点 pj;, pj;+1，…， 
pj;+4 关 联 的 Voronoi 多 边 形 的 边 和 顶点 。 

执行 该 算法 时 ,首先 判定 点 p; 是 否 为 凸 壳 顶点 或 在 凸 壳 内 , 这 只 要 求 出 
CH(S ) ,再 进行 比较 ,其 耗费 为 O(zlogz )。 如 果 点 p;_1、pi、pi+1 是 BCH(S) 上 连 
续 的 三 个 点 , 删 去 点 p; 之 后 ,耗费 O(log2n) 时 间 可 以 恢复 BCH(S - 1p;} ), 即 判定 
Pi-1 与 pi;+1 之 间 是 否 有 新 的 凸 沉 顶点 。 删 去 点 p; 及 p; 关联 的 Voronoi 多 边 形 的 
边 和 顶点 ,修改 相应 的 Voronoi 多 边 形 的 边 和 顶点 ,耗费 常数 时 间 。 因 此 ,算法 的 
时 间 复 杂 性 为 O(nlogn )。 


9.4.5 平面 扫描 算法 


构造 Voronoi 图 的 平面 扫描 算法 是 Fortune 于 1987 年 提出 的 ,其 复杂 性 是 
O(nlogn )。 

平面 扫描 算法 通过 平面 上 的 一 条 扫描 线 由 左 向 右 扫描 ,在 平面 上 已 扫描 过 的 
部 分 就 得 到 问题 的 解 , 而 未 扫描 部 分 还 没有 形成 问题 的 解 。 要 使 构造 Voronoi 图 
的 平面 扫描 算法 能 在 线 已 扫 过 的 部 分 构造 出 Voronoi 图 ,其 困难 是 扫描 线 工 在 碰 
到 决定 Voronoi 域 V(p;) 的 点 p; 之 前 会 遇 到 该 域 的 Voronoi 边 。 为 克服 这 一 困 
难 , 先 介绍 下 面 的 概念 。 

设 点 p 位 于 三 维 坐标 系 的 zy 平面 上 ,顶点 在 p 并 且 其 侧面 以 45" 倾 斜 的 圆锥 
体 垂 直 于 zy 平面 。 如 果 将 第 三 个 变 元 看 成 是 时 间 ,那么 以 p 为 顶点 的 圆锥 体 表 
示 以 单位 速度 在 之 周围 扩张 的 圆 ,* 个 单位 时 间 之 后 , 圆 的 半径 为 1。 

考虑 以 点 pl 和 p; 为 顶点 的 两 个 圆锥 体 Con( pi) 和 Conz (zz ) ,它们 在 三 维 空 
间 中 相交 成 一 条 曲线 ,该 曲线 位 于 垂直 于 zy 平面 的 平面 上 ,这 个 平面 与 zy 平面 
的 交 是 p1p2 的 垂直 平分 线 。 因 此 ,虽然 两 个 圆锥 体 的 交 线 在 三 维 空间 中 是 一 条 曲 
线 ,但 该 曲线 投影 到 zy 平面 上 却 是 一 条 直线 ,而 且 是 Vor( | pi,p2))。 同 样 ,以 点 
Pi、p2 和 ps 为 顶点 的 三 个 圆锥 体 的 交 ( 三 条 曲线 ) 在 zy 平面 上 的 投影 形成 Vor 
(1p1,p2, p31)。 

构造 Voronoi 图 的 平面 扫描 算法 的 基本 想法 是 ,通过 与 zy 平面 成 45" 倾 斜 的 
平面 x 扫描 锥 体 ,x 与 zy 平面 的 交 线 作为 扫描 线 工 。 假 设 工 平行 于 > 轴 , 并 且 它 
的 z 坐标 是 / ,如 图 9.9 所 示 ; 另 设 平面 x 和 锥 体 是 不 透明 的 ,并 从 zx= - oo 向 上 
观察 平面 x 和 锥 体 。 

在 图 9.9 中 , 工 的 z=0( 点 pi、pz 的 二 坐标 为 0) ,此 时 从 下 往 上 观察 ,只 能 看 
见 平面 x, 点 pi 和 ps 在 扫描 线 L 上 ,但 看 不 见 锥 体 ,这 时 是 扫描 的 起 始 时 刻 。 

随后 ,扫描 平面 x 和 扫描 线 工 向 右 平移 ,在 平移 过 程 中 ,平面 x 切割 Con (pi1)， 
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图 9.10 随 着 xx、 的 右 移 ,抛物 线 波 面 的 变迁 


中 本 中 涉 得 并 
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Con( p2) 分 别 形成 抛物 线 Par( pi1) 和 Par(p;), 然 后 将 其 投影 到 zy 平面 , 称 为 抛 
物 线 波 面 ,如 图 9.10 所 示 。 随 着 x 、L 的 右 移 ,两 条 抛物 线 Par(p1) 和 Par(p;) 的 
交 的 轨迹 构成 一 条 抛物 线 Par( Con(p1) 门 Con (p2)), 该 抛物 线 在 zy 平面 上 的 投 
影 即 p1pz 的 垂直 平分 线 。 从 z= - co 向 上 观察 ,抛物 线 Par (Con(p1) 门 Con(p2)) 
是 一 条 直线 段 ,并 且 是 Vor(| pi, p21)。 在 平面 x 和 线 工 已 扫描 过 的 部 分 ,点 pi 
和 pz 及 部 分 Par( Con(p1) 门 Con(p2)) 均 已 形成 ,而 未 扫描 部 分 Par( Con(p1) 门 
Con( ps)) 的 剩余 部 分 还 未 形成 。 直 至 平面 x 离开 Con (ps) 时 ,扫描 终止 ， 
Vor(1pi, pz|) 完 全 形成 。 


思 考题 


1. 编写 增 量 构 造 法 算法 程序 实现 由 离散 点 高 程 点 构建 TIN。 
2. 编写 减 量 算法 程序 实现 由 离散 点 高 程 点 构建 TIN。 
3. 编写 平面 扫描 算法 程序 实现 由 离散 点 高 程 点 构建 TIN。 
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10.1 概 述 


缓冲 区 分 析 (buffer analysis) 是 地 理 信 息 系 统 中 使 用 非常 频繁 的 一 种 空间 分 
析 ,是 对 空间 特征 进行 度量 的 一 种 重要 方法 。 缓 冲 区 是 根据 空间 数据 库 中 的 点 、 
线 ` 面 地 理 实 体 或 规划 目标 , 自动 建立 其 周围 一 定 宽度 范围 的 多 边 形 。 

根据 地 理 实 体 的 不 同 分 为 :点 缓冲 区 、 线 缓冲 区 \ 面 缓冲 区 和 复杂 实体 缓冲 区 。 
点 缓冲 区 ,是 围绕 该 点 的 半径 为 缓冲 距 的 圆周 所 包围 的 区 域 ; 线 缓冲 区 ,是 沿线 的 
两 侧 距 离 不 超过 缓冲 距 的 点 组 成 的 区 域 ; 面 缓冲 区 ,是 沿 该 面 边 界线 内 侧 或 外 侧 距 
离 不 超过 缓冲 距 的 点 组 成 的 区 域 ;复杂 目标 的 缓冲 区 , 则 须 经 过 复杂 的 计算 和 判断 
生成 一 个 复杂 多 边 形 或 多 边 形 集合 。 不 同类 型 空间 目标 的 缓冲 区 如 图 10.1 所 示 。 


10.2 缓冲 区 边界 生成 算法 基础 


在 缓冲 区 分 析 中 ,关键 算法 是 缓冲 区 边界 的 生成 ,边线 关系 处 理 和 多 个 缓冲 区 
的 合并 。 点 目标 的 缓冲 区 生成 算法 ,就 是 确定 以 点 目标 为 中 心 ,缓冲 距 为 半径 的 
圆 ; 线 目标 的 缓冲 区 生成 算法 ,就 是 将 线 目标 的 轴线 向 两 侧 沿 法 线 方向 平移 一 个 组 
冲 距 ,端点 用 半圆 弧 连 接 , 所 得 到 的 点 构成 的 多 边 形 ; 面 目标 的 缓冲 区 生成 算法 ,就 
是 将 面目 标的 边界 上 的 点 向 外 侧 沿 法 线 方向 平移 一 个 缓冲 距 , 所 得 到 的 点 构成 的 
多 边 形 。 这 里 ,首先 引入 以 下 几 个 概念 。 


1. 轴线 的 左 侧 和 右 侧 

以 轴线 的 前 进 方向 为 准 ,前 进 方向 的 左 侧 称 为 轴线 的 左 侧 ,前 进 方向 的 右 侧 称 
为 轴线 的 右 侧 (图 10.2)。 
2. 多 边 形 的 方向 


多 边 形 边界 顺 时 针 方 向 称 为 正方 向 , 逆 时 针 方向 称 为 负 方向 。 采 用 计算 面积 
是 为 正 或 负 值 的 方法 判断 多 边 形 的 方向 ,计算 面积 为 正 的 多 边 形 称 为 正 向 多 边 形 ， 
计算 面积 为 负 值 的 多 边 形 称 为 负 向 多 边 形 (图 10.3)。 
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(a) 点 缓冲 区 (b) 线 缓冲 区 (c) 面 缓冲 区 





(d) 复杂 目标 缓冲 区 


图 10.1 不 同类 型 空间 目标 的 缓冲 区 


正 向 多 边 形 负 向 多 边 形 


图 10.2 轴线 的 左 侧 和 右 侧 图 10.3 多 边 形 的 方向 图 图 10.4 缓冲 区 的 外 侧 和 内 侧 
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3. 缓冲 区 的 外 侧 和 内 侧 


缓冲 区 的 外 边界 是 正 向 多 边 形 , 岛 边界 是 负 向 多 边 形 。 以 多 边 形 前 进 方向 为 
准 , 多 边 形 边界 的 左 侧 称 为 缓冲 区 的 外 侧 , 多 边 形 边界 右 侧 称 为 缓冲 区 的 内 侧 
(图 10.4)。 


4. 轴线 (边界 ) 转 折 点 的 凸凹 性 


轴线 或 边界 上 的 相 邻 三 点 P;_1、P;、Pi+1, 用 右手 螺旋 法 则 , 若 拇 指向 下 , 则 P; 
点 左 侧 为 凸 , 右 侧 为 止 ; 若 拇指 向 上 , 则 P; 点 左 侧 为 止 , 右 侧 为 凸 。 


10.3 点 缓冲 区 边界 生成 算法 


点 目标 的 缓冲 区 是 围绕 点 目标 的 半径 为 缓冲 距 的 圆周 所 包围 的 区 域 ,点 目标 
缓冲 区 边界 生成 算法 的 关键 是 确定 点 目标 为 中 心 的 圆周 。 为 了 便于 进一步 将 多 个 
点 缓冲 区 合并 ,这 里 采用 步 进 拟 合 的 思想 , 即 圆 弧 弥 合 的 方法 , 它 是 将 圆心 角 等 分 ， 
用 等 长 的 弦 代 蔡 圆 弧 , 即 用 均匀 步 长 的 直线 段 副 近 圆 弧 段 (图 10.5)。 显 然 ,等 分 
的 圆心 角 越 小 , 步 长 越 小 ,误差 越 小 ;等 分 的 圆心 角 越 大 , 步 长 越 大 ,误差 越 大 。 


10.5 不 同步 长 的 圆 弧 弥 合 


圆 绝 弥 合 的 思想 从 几何 的 角度 比较 容易 理解 。 如 图 10.6 所 示 ,因为 所 求 缓冲 
区 外 边界 是 正 向 多 边 形 , 故 按 顺 时 针 方 向 
弥合 。 已 知 半径 为 尺 ( 缓 冲 距 ) 的 圆 弧 上 
的 一 点 4A(az,ay), 求 顺 时 针 方向 的 步 长 
为 a 的 弥合 点 刀 (b,2), 即 用 弦 长 AB 
代替 圆 跌 AB 。 

假设 OA4 的 方向 角 为 8, OB 的 方向 
角 为 7, 则 y=B 一 a。 于 是 有 ce 


人 = Reosy = Qzcosa + aysina 








by, = Reosy = aycosa + azrsina 


图 10.6 顺 时 针 圆 弧 弥 合 


(10.1) 
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对 整个 圆周 ,根据 精度 要 求 ,给 定 布点 个 数 n (圆周 上 弥合 的 点 数 ), 并 计算 步 
长 。a=[360/n]。 从 点 (R,O 〇 ) 开 始 ,通过 不 断 增 加 步 长 的 倍数 (小 于 或 等 于 布点 
个 数 ) ,依次 求 得 弥合 点 ,最 后 强制 闭合 回 到 点 (R,O 〇 )。 按 弥合 顺序 连接 这 些 点 ， 
就 得 到 点 目标 的 缓冲 区 边界 。 
同 理 , 逆 时 针 圆 弧 弥 合 的 公式 为 
= Qzcosa 一 aysina 


(10.2) 


by = Qzcosa + aysina 


10.4 线 绥 神 区 边界 生成 算法 


线 目 标 缓冲 区 边界 的 生成 比较 复杂 ,分 为 以 下 几 个 步骤 :先生 成 缓冲 区 边界 ， 
然后 对 可 能 出 现 的 尖 角 和 四 陷 等 特殊 情况 做 进一步 处 理 , 最 后 进行 自 相交 处 理 以 
区 别 缓冲 区 的 外 边界 和 岛 边 界 。 每 个 步骤 的 原理 和 具体 算法 如 下 。 


1. 缓冲 区 边界 生成 


缓冲 区 边界 生成 的 核心 算法 是 双 线 问题 ,主要 有 和 角 平 分 线 法 和 凸 角 圆 弧 法 。 
由 于 角 平 分 线 法 难以 最 大 限度 地 保证 双 线 的 等 宽 性 、 校 正 过 程 复杂 、 算 法 模型 欠 结 
构 化 ,所 以 通常 采用 凸 角 圆 弧 法 。 

凸 角 圆 弧 法 的 基本 思想 是 (图 10.7) :在 轴线 的 两 端 用 半径 为 缓冲 距 的 圆 弧 弥 
合 ;在 轴线 的 各 转折 点 ,首先 判断 该 点 的 凸 丫 性 ,在 凸 侧 用 半径 为 缓冲 距 的 圆 弧 弥 
合 , 在 止 例 用 与 该 点 关联 的 前 后 两 相 邻 线段 的 偏 移 量 为 缓冲 距 的 两 平行 线 的 交点 
作为 对 应 顶点 。 这 样 ,在 凸 侧 用 圆 弧 拟 合 ,保证 平行 线 与 轴线 等 宽 ;而 在 凹 侧 平 行 
线 交 点 在 角 平 分 线 上 。 所 以 , 凸 角 圆 弧 法 能 够 最 大 限度 地 保证 生成 的 缓冲 区 边界 
与 轴线 的 等 宽 关 系 。 将 这 些 圆 弧 弥合 点 和 平行 线 交 点 依 一 定 的 顺序 连接 起 来 , 即 
形成 闭合 的 缓冲 区 边界 。 凸 角 圆 弧 法 的 关键 算法 如 下 。 






入 


图 10.7 凸 角 圆 弧 法 原理 
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1) 判断 轴线 转折 点 的 凸凹 性 


轴线 转折 点 的 凸 四 性 决定 何 处 用 圆 弧 弥合 , 何 处 用 平行 线 求 交 。 这 个 问题 可 
以 转化 为 两 个 矢量 的 又 积 (图 10.8) :把 与 转折 点 相 邻 的 两 个 线段 看 成 两 个 矢量 
Pi -1、P ,其 方向 取 坐 标点 序 方向 。 知 已 -1 以 最 小 的 角度 扫 疝 P; 时 为 道 时针, 则 
该 点 左 侧 为 凸 , 右 侧 为 凸 ; 若 已 -1 以 最 小 的 角度 扫 向 P; 时 为 顺 时 针 , 则 该 点 左 侧 
为 凸 , 右 侧 为 凹 。 


a S 
2 © 
人 克 Pi D, 
@ 人 
RY ~~ 


图 10.8 转折 点 的 凹凸 性 与 矢量 的 又 积 


由 矢量 代数 可 知 ,在 求 矢量 又 积 时 ,遵循 右手 法 则 。 即 拇指 向 上 , P, .1P; Pi+1 
呈 逆 时 针 方 向 ,矢量 P;_1、P; 的 又 积 S 为 正 ;拇指 向 下 , P, .1P; Pi+1 呈 顺 时 针 方 
向 ,S 为 负 。 矢量 P;_1P; 可 用 其 端点 的 坐标 来 表示 , 即 
9 = 也-1…P， 
= (zpi — zp;1) (ypirt — ypi) — (zpiri — xpi) (ypi -TD) (10.3) 
S 有 如 下 三 种 情况 : 
车 S 为 正 ; 则 P;_1P;P;41 呈 逆 时 针 方向 
上 S 为 负 , 则 Pi;-1PiP;+1 基 顺 时 针 方 向 
若 S 为 零 , 则 Pi-1PiPi41 三 点 共 线 


2) 求 与 转折 点 相 邻 的 两 线段 的 方向 角 


如 图 10.9 所 示 ,与 转折 点 已 相 邻 的 两 线段 的 方向 角 是 以 P; 为 原点 ,从 二 轴 
正方 向 逆 时 针 旋 转 到 该 线段 的 角度 。 确 定 与 转折 点 相 邻 的 两 线段 的 方向 角 ,是 后 
续 的 圆 弧 弥 合 和 平行 线 求 交 的 前 提 。 

3) 来 与 P; 相 邻 的 两 线段 平行 线 交 点 


在 以 转折 点 P; 为 原点 的 坐标 系 中 ,假设 相 邻 两 线段 的 方向 角 分 别 为 a1、a2， 
缓冲 距 为 R ,平行 线 交点 P(x , ys) 到 转折 点 P; 的 距离 为 4 , 因 平行 线 的 交点 在 角 
平分 线 上 , 令 角 平 分 线 的 方向 角 为 <, 则 有 


民 R=Q&xsn(a -as) = ycosa 一 osina 
1 i (10.4) 


R= dxsin(al ~ a) = zosina2 一 ypcosal 
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P.(0,0) 


图 10.9 转折 点 相 邻 两 线段 方向 角 的 求解 


Th = R(cosal + cosa2)/sin(a> — a1) 
1 p 1 2 2 1 (10.5) 


yp = R(sinal + sina2)/sin(a2 — a1) 
令 转折 点 P; 的 图 面 坐标 为 z。、yy ,平行 线 交 点 P 的 图 面 坐标 为 (x ,y )。 若 
平行 线 交 点 在 轴线 左 侧 , 则 x = x + zy = yp + yp; 若 平行 线 交 点 在 轴线 右 侧 ， 


则 z= zp -Tp y = yp, -ype 
4) 确定 圆 狐 弥合 的 起 始点 、 终 止 点 和 方向 


如 图 10.10 所 示 , 圆 驱 弥 合 的 起 始点 是 转折 点 沿 前 一 线段 的 法 线 方向 向 远离 
轴线 方向 平移 一 个 缓冲 距 得 到 的 点 ;终止 点 是 转折 点 沿 后 一 线段 的 法 线 方 向 向 远 
离 轴线 方向 平移 一 个 缓冲 距 所 得 到 的 点 ;在 起 始点 和 终止 点 相同 的 情况 下 , 若 圆 弧 
弥合 方向 不 同 ,其 结果 是 不 同 的 ,为 保证 生成 的 缓冲 区 边界 是 顺 时 针 方 向 ,必须 考 
虑 圆 弧 弥合 的 方向 , 即 轴 线 左 侧 圆 弧 弥合 是 顺 时 针 方 向 ,轴线 右 侧 圆 弧 弥 合 是 逆 时 
针 方 向 。 





图 10.10 圆 缴 弥 合 的 起 始点 终止 点 和 方向 
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2. 失真 现象 处 理 


前 述 算法 生成 的 缓冲 区 边界 ,轴线 转角 尖锐 的 转折 点 的 平行 线 交 点 随 缓 冲 距 
的 增 大 将 会 迅速 远离 轴线 ,这 就 会 出 现 尖 角 和 凹陷 的 失真 现象 (图 10.11) ,这 是 不 
合理 的 ,必须 进行 修正 。 





图 10.11 失真 现象 示意 图 


化 洁 晕 于 1999 年 通过 大 量 实验 和 分 析 总 结 ,将 缓冲 区 边界 失真 现象 归纳 为 三 
类 16 种 情况 ,针对 不 同 的 情况 采用 不 同 的 修正 处 理 方法 。 

在 介绍 三 类 情况 的 判断 条 件 及 修正 方法 之 前 , 先 对 用 到 的 符号 作 如 下 约定 : 

(1) (i 一 1)、i、(i+1) 表 示 边 界 列表 的 相 邻 结 点 元 素 , 可 能 是 单 点 一 一 平行 线 
交点 ,也 可 能 是 点 串 圆 弧 弥 合 点 。 

(2) 点 1.2、3、4、5 表示 缓冲 区 边界 上 的 点 ,其 中 ,点 1 表示 (i -1) 的 前 一 个 结 
点 元 素 的 最 后 一 个 点 ;点 2 表示 (i 一 1) 的 最 后 一 个 点 ;点 4 表示 (i+1) 的 第 一 个 
点 ;点 5 表示 (zi+1) 的 后 一 个 结 点 元 素 的 第 一 个 点 ;由 于 讨论 的 三 类 情况 中 , 结 点 
元 素 i 总 是 单 点 ,用 点 3 表示 。 

(3) flagl 表示 点 2 的 凹凸 性 ,flagl1=1 说明 点 2 左 侧目 右 侧 凸 ,flagl= 一 1 说 
明 点 2 左 侧 凸 右 侧门 ; 同 理 ,flag2 表示 点 4 的 四 凸 性 ,key 表示 点 3 的 止 凸 性 。 

(4) Ki 表示 点 2 与 (i +1) 位 置 关系 ,Ki1=1, 表 示 点 2 在 (i+1) 的 左 侧 ;K) = 
0, 表 示 点 2 在 (i+1) 的 右 侧 。 同 理 K, 表示 点 4 与 (i 一 1) 的 位 置 关系 ,K,=1, 表 
示 点 4 在 (i 一 1) 的 左 侧 ;K,=0, 表 示 点 4 在 (i 一 1) 的 右 侧 。 

下 面 分 别 讨论 三 类 情况 的 判断 条 件 和 修正 方法 。 

第 一 类 情况 :(i 一 1) 是 圆 弧 弥 合 点 串 ,i 是 平行 线 交 点 , (i +1) 是 圆 弧 弥合 点 
串 。 这 类 情况 出 现 的 失真 现象 的 判断 条 件 和 修正 方法 见 表 10.1。 
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表 10.1 第 一 类 情况 的 判断 条 件 和 处 理 方法 












































判断 条 件 图 例 求 交 线段 ( 圆 弧 ) 修正 后 点 序 
flagl= -1 1 , 
AN 1,2,3,4,5 
ey= Ee 
(无 失真 
flag2= = ke 
3 
Ki=1 
(i—1),(i+1) 1,P,5 
K;=0 1 5 
4 2 | 
Ey 3 
flagl=1 Ki=1 1 . 
key=1 23,(i+1) 1325 Ps 
KkK,=0 > 3 
flag2=1 4 P 
3 
Ki=0 
34,(i—1) 1,P,4,5 
天 2 三 1 
flagl= 一 1 
key= 一 1 23,(i+1) 1,2,P,5 
flag2=2 
5 
flagl =1 4 
key= —1 34,(i1—1) 1,P,4,5 











第 二 类 情况 :(i -1) 是 圆 弧 弥合 点 串 ,i 是 平行 线 交 点 , (i + 1) 是 平行 线 交 点 。 
这 类 情况 出 现 的 失真 现象 的 判断 条 件 和 修正 方法 见 表 10.2。 
第 三 类 情况 :(i 一 1) 是 平行 线 交 点 ,i 是 平行 线 交点 , (i +1) 是 圆 弧 弥合 点 捉 。 
这 类 情况 出 现 的 失真 现象 的 判断 条 件 和 修正 方法 见 表 10.3。 
为 方便 表示 , 表 中 的 图 例 均 只 给 出 生成 的 缓冲 区 边界 ,而 未 画 出 轴线 。 


表 10.2 第 二 类 情况 的 判断 条 件 和 处 理 方法 













判断 条 件 图 例 求 交 线段 ( 圆 弧 ) 修正 后 点 序 
:ss 
1,2,3,4,5 
ES (无 失真 ) 
2Y3 











45,(i—1) 
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判断 条 件 


求 交 线段 ( 圆 弧 ) 














34,(i—1) 




















求 交 线 段 ( 圆 弧 ) 修正 后 点 序 


























. - 
NS 12, (i+1) 1,P,5 
Be] 
4 > 


23,(i+1) 

















3. 自 相交 处 理 





23,(i+1) 









当 轴 线 的 弯曲 空间 不 能 容许 缓冲 区 的 边界 自身 无 压 盖 地 通过 时 ,产生 边界 的 
自 相 交 问 题 , 形 成 多 个 自 相交 多 边 形 。 自 相交 现象 形成 的 多 边 形 分 为 两 种 情况 , 即 
岛屿 多 边 形 和 重 全 多边形。 缓冲 区 边界 自 相 交 处 理 的 关键 是 识别 岛屿 多 边 形 和 重 
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又 区 多 边 形 。 算 法 的 基本 思想 是 : 求 出 缓冲 区 边界 上 的 自 相 交点 ,判断 这 些 点 是 人 
点 还 是 出 点 ,判断 自 相 交点 之 间 确 定 的 自 相交 多 边 形 的 性 质 ,是 岛屿 多 边 形 则 保 
留 ,否则 保留 面积 最 大 的 正 向 多 边 形 为 外 边界 。 


自 相 交 处 理 的 关键 算法 如 下 : 
1) 判断 自 相 交点 是 入 点 还 是 出 点 
4 2 经 过 前 述 处 理 过 程 生成 的 缓冲 区 边界 点 串 


是 顺 时 针 方 向 , 即 轴 线 始 终 位 于 边界 前 进 方向 
的 右 侧 。 和 点 是 从 缓冲 区 外 侧 进入 内 侧 的 自 相 
交点 ,出 点 是 从 缓冲 区 内 侧 出 到 外 侧 的 自 相 交 
点 。 同 一 个 自 相 交点 ,对 于 相交 的 两 线段 具有 
相反 的 人 出 特性 。 如 图 10.12 所 示 , 交 点 K( 是 

线段 12 的 人 点 ,是 线段 34 的 出 点 )。 
1 3 前 面 介绍 的 利用 矢量 又 积 判断 转折 点 凸凹 
图 10.12 交点 的 人 出 特征 性 的 思想 ,对 于 判断 交点 的 人 出 特性 同样 适用 。 
利用 矢量 叉 积 判断 交点 入 出 特性 的 基本 方法 
是 : 求 第 一 个 线段 的 起 点 、 交 点 K 确定 的 矢量 与 交点 K ,第 二 个 线段 的 终点 确定 的 
矢量 叉 积 ,判断 矢量 又 积 的 方向 , 若 为 负 , 则 交点 K 是 第 一 个 线段 的 出 点 ,是 第 二 
个 线段 的 人 点 ; 若 为 正 , 则 K 是 第 一 个 线段 的 入 点 ,是 第 二 个 线段 的 出 点 。 以 图 
10.12 为 例 把 交点 K 作为 转折 点 ,考察 线段 12 的 起 点 1 、 交 点 K 确定 的 矢量 和 交 
点 KK 线段 34 的 终点 4 确定 的 矢量 的 又 积 方向 ,为 正 , 则 交点 K 是 线段 12 的 入 
点 ;考察 线段 34 的 起 点 3、 交 点 K 确定 的 矢量 和 交点 K 线段 12 的 终点 2 确定 的 

矢量 的 又 积 方向 ,为 负 , 则 交点 K 是 线段 34 的 出 点 。 


2) 判断 自 相 交 多 边 形 是 岛屿 还 是 重 登 区 


经 过 前 述 处 理 过 程 生 成 的 缓冲 区 边 
界 是 顺 时 针 方 向 ,边界 自 相 交 形 成 的 多 边 
形 中 , 负 向 多 边 形 是 岛屿 , 即 岛 屿 的 边界 
是 逆 时 针 方 向 ; 正 向 多 边 形 中 ,面积 最 
大 者 是 外 边界 , 其 他 都 是 重 至 区。 如 
图 10.13 所 示 , 实 线 表 示 外 边界 ,阴影 部 
分 表示 岛屿 。 
自 相 交 处 理 的 基本 步骤 如 下 : 
第 一 步 ,初始 化 max = 0,i =2;max : 
保存 最 大 正面 积 。 图 10.13 岛屿 与 外 边界 示意 图 
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第 二 步 ,获取 边界 点 串 点 数 count, 由 于 在 算法 过 程 中 有 对 边界 的 删除 和 插入 
操作 , 故 count 是 变化 的 。 

第 三 步 , 判 断 ;< count, 若 是 则 继续 ,否则 结束 。 

第 四 步 , 取 边界 上 的 线段 L;,; ;1 

第 五 步 ,依次 由 近 及 远 取 L;,; ;1 之 前 的 线段 L;,L; 1 判断 是 否 取 完 边 界 点 串 
上 工 ; ,i+1 之 前 的 所 有 线段 ,若是 则 转 第 十 步 ,否则 继续 。 

第 六 步 ,L;, ;+11 与 上 ;,;+1 是 否 相 交 , 若 是 则 继续 ,否则 转 第 五 步 。 

第 七 步 ,从 边界 上 删除 交点 之 间 的 点 ,构成 一 个 自 相 交 多 边 形 ring 是 基本 坐 
标点 数组 ,保存 交点 之 间 构 成 的 自 相交 多 边 形 ,把 交点 插入 边界 适当 位 置 。 

第 八 步 ,ring 的 面积 , 若 a >0,ring 保存 为 island( 索 引 点 数组 ,保存 岛屿 多 边 
形 , 通 过 设置 索引 点 的 端点 标志 ,可 以 表示 多 个 岛屿 多 边 形 ); 吞 a >0, 判 断 a > 
max, 是 则 max = a ,border 清空 ,ring 保存 为 border(border 是 基本 坐标 点 数组 , 保 
存 外 边界 )。 

第 九 步 ,ring 清空 ,i =j, 转 第 二 步 。 

第 十 步 ,; = i+1, 转 第 二 步 。 

算法 执行 的 结果 ,是 生成 顺 时 针 方 向 的 缓冲 区 外 边界 border 和 逆 时 针 方向 的 
多 个 岛 边 界 island。 


“10.5 面 缓冲 区 边界 生成 算法 


面目 标 缓冲 区 边界 生成 算法 是 单线 问题 ,采用 的 依然 是 凸 角 圆 弧 法 的 基本 思 
想 。 首 先 判 断 边界 上 每 个 转折 点 的 凸 媚 性 ;在 左 侧 为 凸 的 转折 点 用 半径 为 缓冲 距 
的 圆 弧 弥 合 ,在 左 侧 为 凹 的 转折 点 用 平行 线 求 交 ; 接 下 来 是 对 生成 的 缓冲 区 边界 进 
行 特殊 情况 处 理 和 自 相交 处 理 。 有 具体 方法 与 线 目 标 缓冲 区 的 相同 。 


10.6 多 目标 缓冲 区 合并 算法 


前 面 介绍 的 是 单 目标 缓冲 区 边界 生成 的 算法 设计 ,对 于 由 点 目标 、 线 目标 和 面 
目标 组 合 而 成 的 复杂 目标 的 缓冲 区 ,是 在 单 目标 缓冲 区 的 基础 上 ,多 个 单 目 标 缓冲 
区 合并 ,产生 复杂 目标 的 缓冲 区 。 多 个 单 目 标 缓冲 区 的 合并 一 般 采 用 两 两 合并 的 
方法 , 即 先进 行 两 个 缓冲 区 的 合并 ,得 到 的 新 的 缓冲 区 再 与 第 三 个 缓冲 区 进行 合 
并 …… 直 到 所 有 的 缓冲 区 合并 完 。 显 然 ,缓冲 区 合并 的 关键 是 如 何 进 行 两 两 缓冲 
区 的 合并 ,如 图 10.14 所 示 。 

以 下 介绍 “GIS 缓冲 区 重 倒 合并 的 快速 算法 ”。 
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图 10.14 ”两 个 多 边 形 合并 ( 实 线 表示 外 边界 ,阴影 表示 岛屿 ) 


1. 相关 概念 及 性 质 


单个 目标 缓冲 区 多 边 形 独立 生成 过 程 中 产生 的 所 有 闭合 缓冲 区 多 边 形 分 为 正 
缓冲 区 多 边 形 和 负 缓 冲 区 多 边 形 两 种 ,它们 的 定义 如 下 。 

定义 :闭合 多 边 形 包含 的 内 部 区 域 为 缓冲 区 范围 的 多 边 形 称 为 正 缓冲 区 多 边 
形 ,闭合 多 边 形 内 部 包含 的 区 域 不 为 缓冲 区 范围 的 多 边 形 称 为 负 缓冲 区 多 边 形 。 
图 10.15 中 的 A 多 边 形 为 正 缓冲 区 多 边 形 ,B 多 边 形 为 负 缓冲 区 多 边 形 。 由 于 组 
冲 区 的 重奏 ,缓冲 区 多 边 形 边 界线 必然 相交 ,其 交点 称 为 结 点 。 构 成 结 点 的 缓冲 区 
边界 线 称 为 结 点 上 的 弧 段 。 由 四 条 弧 段 构成 的 结 点 称 为 四 弧 段 结 点 。 由 四 条 以 上 
弧 段 构成 的 结 点 称 为 非 四 弧 段 结 点 。 构 成 结 点 的 缓冲 区 多 边 形 称 为 与 结 点 有 关 的 
多 边 形 。 

性 质 1: 如 果 在 独立 生成 每 个 地 理 目标 (点 、 线 、 面 ) 的 缓冲 区 时 ,都 限定 先 沿 原 
曲线 前 进 方向 (坐标 存储 序列 方向 ) 在 其 左 侧 生成 一 半 缓 冲 区 边界 线 , 然 后 再 沿 原 
曲线 前 进 方向 的 相反 方向 的 左 侧 生成 另 一 半 缓 冲 区 边界 线 ,那么 所 有 正 缓冲 区 多 
边 形 的 方向 相对 其 多 边 形 包含 区 域 来 讲 都 是 顺 时 针 ,而 负 缓冲 区 多 边 形 的 方向 相 
对 其 多 边 形 包含 区 域 来 讲 都 是 逆 时 针 。 图 10.15 中 A 多 边 形 坐 标 存储 序列 方向 
相对 多 边 形 内 部 区 域 为 顺 时 针 ,B 多 边 形 坐标 存储 序列 方向 相对 多 边 形 内 部 区 域 


为 逆 时 针 。 
性 质 2: 每 个 结 点 上 弧 段 的 个 数 最 少 为 4, 最 多 不 限 ,但 必 为 2 的 倍数 ( 记 
为 27) o 


性 质 3: 在 每 个 结 点 的 2n 条 弧 段 中 ,相对 结 点 而 言 ,一 定 存在 n 条 强 段 的 坐 
标 存储 序列 方向 指向 结 点 ,而 另 ”条 弧 段 的 坐标 存储 序列 方向 则 背离 结 点 。 本 章 
将 坐标 存储 序列 方向 指向 结 点 的 弧 段 称 为 当前 结 点 的 朝向 弧 ,坐标 存储 序列 方向 
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图 10.15 正 、 负 缓冲 区 多 边 形 示意 图 


背离 结 点 的 弧 段 被 称 为 当前 结 点 的 背 向 弧 。 
性 质 4: 每 个 结 点 上 的 2” 条 弧 段 一 定 来 自 个 缓冲 区 多 边 形 , 在 2n 条 弧 段 
中 有 且 仅 有 两 个 弧 段 属于 同一 个 缓冲 区 多 边 形 。 


2. 不 同 线 状 目标 缓冲 区 的 重 伙 合并 


1) 四 芍 段 结 点 上 弧 段 取舍 规则 


四 绝 段 结 点 是 缓冲 区 多 边 形 重奏 时 形成 的 最 常见 和 基本 的 结 点 ,因此 关于 四 
弧 段 结 点 上 弧 段 取舍 的 规则 对 有 效 地 实现 缓冲 区 多 边 形 重生 合并 至 关 重要 。 缓 冲 
区 多 边 形 的 重合 合并 可 分 为 两 个 正 缓 冲 区 多 边 形 的 重合 合并 [图 10.16(a)] .一 个 
止 缓 冲 区 多 边 形 和 一 个 负 缓 冲 区 多 边 形 的 重合 合并 [图 10.16(b)] 及 两 个 负 缓 冲 
区 多 边 形 的 重合 合 并 [图 10.16(c)] 三 种 情况 。 从 图 中 容易 发 现 无 论 是 两 个 什么 
伴 的 缓冲 区 多 边 形 发 生 重 至, 经 求 交 计算 后 ,必然 产生 两 个 四 弧 段 结 点 。 在 每 个 四 
弧 段 结 点 的 四 条 弧 段 中 ,有 一 部 分 弧 段 是 因 缓 冲 区 重 伙 合并 需要 删除 的 。 根 据 不 
同类 型 缓冲 区 的 重奏 情况 , 弧 段 删除 的 规则 不 同 ,但 都 涉及 到 某 一 弧 段 是 否 落 在 特 
定 多 边 形 中 的 判断 。 例 如 ,对 于 两 个 正 缓冲 区 多 边 形 的 重 肆 合并 问题 需要 先 判断 
一 条 弧 段 是 否 落 在 对 方 缓冲 区 多 边 形 内 ,如 果 是 , 则 此 弧 段 为 需要 删除 的 ,否则 ,此 
弧 段 为 需要 保留 的 弧 段 。 弧 段 与 多 边 形 包容 关系 判断 等 价 于 弧 段 上 任意 一 点 与 多 
边 形 包 容 关系 的 判断 。 点 与 多 边 形 包容 关系 的 判断 是 矢量 图 形 基本 关系 判断 之 
一 ,需要 一 定 的 计算 量 。 

为 了 提高 缓冲 区 多 边 形 重 秋 合并 的 计算 效率 ,本 章 介绍 了 一 种 可 以 避免 计算 
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(a) 两 正 缓 溃 区 重生 (b) 正 、 负 缓冲 区 重要 (c) 两 负 缓冲 区 重 释 





图 10.16 缓冲 区 多 边 形 重 芍 合并 的 三 种 情况 


点 与 多 边 形 包容 关系 的 弧 段 删除 规则 , 即 : 绝 段 正 负 关系 删除 规则 。 具 体 思 想 是 : 
在 四 弧 段 结 点 上 ,用 负 号 “ ”代表 来 向 弧 , 用 正 号 “+ "代表 去 向 弧 。 在 每 条 弧 段 
上 ,分 别 选 距 结 点 最 近 的 点 与 结 点 构成 四 条 有 向 线段 ,有 向 线段 的 起 始点 均 选 在 结 
点 上 。 用 有 向 线段 所 在 弧 段 的 来 向 或 去 向 的 正 负 号 对 每 条 有 向 线段 进行 标号 (+ 
或 -) 。 显 然 对 于 四 条 有 向 线段 中 的 任意 一 条 线段 都 可 以 找到 其 左右 两 条 线段 。 
表 10.4(a) 、(b) 、(c) 分 别 代表 两 个 正 缓 冲 区 多 边 形 的 重 又 合并 一 个 正 缓冲 区 多 
边 形 和 一 个 负 缓 冲 区 多 边 形 的 重合 合并 及 两 个 负 缓 冲 区 多 边 形 的 重 伙 合并 三 种 情 
况 下 四 弧 段 结 点 上 每 条 有 向 线段 左右 弧 段 正 负 关系 。 表 中 线段 号 前 带 “3” 号 线段 
所 在 的 弧 段 为 合并 过 程 中 应 保留 的 弧 段 。 由 三 个 表 可 以 归纳 出 利用 绝 段 左右 正 负 
关系 进行 弧 段 删除 的 规则 为 ; 当 一 个 弧 段 的 左 弧 段 为 来 向 纤 段 而 右 弧 段 为 去 向 弧 
段 时 ,此 弧 段 为 需 保留 的 弧 段 ,否则 此 弧 段 为 需 删 除 的 弧 段 。 根 据 此 弧 段 删除 规则 
图 10.16 中 三 种 重 从 情况 的 合并 结果 ,如 图 10.17 所 示 。 


表 10.4 缓冲 区 多 边 形 重 又 合并 三 种 情况 下 四 弧 段 结 点 上 有 向 线段 左右 弧 段 正 负 关 系 


























(a) 两 正 缓冲 区 重重 (b) 正 、 仙 缓冲 区 重合 (c) 两 负 缓 冲 区 重 又 


2) 三 种 特殊 情况 的 处 理 


在 实际 计算 缓冲 区 重要 合并 中 ,有 时 会 遇 到 三 种 特殊 情况 , 即 :中 两 缓冲 区 多 
边 形 正好 相 切 在 一 个 结 点 上 ;@@ 三 个 以 上 缓冲 区 多 边 形 重 故 可 能 产生 的 非 四 弧 段 
结 点 ( 结 点 上 弧 段 数 大 于 或 等 于 6); 加 当 每 个 地 理 目 标 单独 生成 缓冲 区 多 边 形 的 
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用 


(a) 两 正 缓冲 区 重合 合并 结果 (b) 正 、 负 缓冲 区 重 登 合并 结果 (©) 两 负 缓冲 区 重合 合并 结果 
图 10.17 缓冲 区 多 边 形 重要 情况 的 合并 结果 


缓冲 距离 不 等 时 ,一 些 目标 的 缓冲 区 多 边 形 可 能 完全 被 其 他 目标 的 缓冲 区 多 边 形 
覆盖 。 下 面 分 别 介绍 这 三 种 特殊 情况 的 处 理 方 法 。 对 于 第 一 种 情况 的 处 理 方法 比 
较 简 单 ,因为 缓冲 区 相 切 形成 的 四 弧 段 结 点 与 缓冲 区 相交 形成 的 四 弧 段 结 点 的 有 
向 线段 左右 正 负 关系 表明 显 不 同 ,所 以 可 以 通过 有 向 线段 左右 正 负 关系 表 将 这 两 
种 四 强 段 结 点 区 分 开 。 绥 冲 区 相 切 形成 的 四 弧 段 结 点 没有 必要 进行 重合 合并 。 处 
理 非 四 弧 段 结 点 的 基本 思想 是 将 非 四 弧 段 结 点 分 解 为 多 组 四 弧 段 结 点 进行 处 理 。 
分 解 的 原则 是 每 组 四 弧 段 必须 仅 来 自 两 个 多 边 形 。 对 于 第 三 种 特殊 情况 ,需要 在 
相交 缓冲 区 重合 合并 后 ,对 未 参加 重 释 合 并 的 多 边 形 与 重合 合并 后 的 多 边 形 进行 
包容 关系 判断 。 这 样 做 的 原因 是 被 其 他 目标 的 缓冲 区 多 边 形 完全 覆盖 的 缓冲 区 多 
边 形 不 可 能 参与 多 边 形 边界 相交 重合 合并 计算 。 


3. 缓冲 区 多 边 形 重 从 合并 的 具体 过 程 


(1) 对 根据 所 有 目标 生成 的 缓冲 区 多 边 形 进行 矢量 曲线 整体 求 交 计算 。 生 成 
表 10.5 所 示 的 结 点 - 弧 信 息 表 。 

(2) 在 结 点 - 弧 信息 表 中 , 删 掉 由 于 多 边 形 相 切 而 形成 的 四 弧 段 结 点 ,将 非 四 
弧 段 结 点 分 解 成 多 个 四 弧 段 结 点 ,从 而 得 到 规范 化 的 结 点 - 强 信 息 表 , 即 结 点 上 弧 
段 的 个 数 均 为 4。 

(3) 按 顺 序 从 第 一 个 结 点 开始 ,首先 生成 有 向 线段 左右 绝 段 正 负 关系 表 , 然 后 
根据 本 节 提 出 的 弧 段 删除 规则 对 弧 段 进行 删除 操作 。 

(4) 将 保留 弧 段 根据 结 点 连接 信息 进行 连接 ,逐渐 生成 合并 后 的 缓冲 区 多 
边 形 。 

(5) 对 未 参加 重 倒 合并 的 多 边 形 与 重合 合并 后 的 多 边 形 进行 包容 关系 判断 。 


，200 ， 地 理 信息 系统 算法 基础 





表 10.5 结 点 - 弧 的 信息 
结 点 标号 :Node _ Id 
结 点 上 绝 段 的 个 数 :Arc_ Numb(4,6,…,2n) 











第 一 条 弧 的 出 入 特性 码 :In _ Out( + 或 ~-) 





第 一 条 弧 所 属 的 多 边 形 的 标号 :Poly _ Id 





第 一 条 弧 所 属 的 多 边 形 的 特性 码 ;Poly _ Feature( + 或 -) 
第 二 条 统 的 出 人 特性 码 :In_ Out( + 或 ~) 
第 二 条 弧 所 属 的 多 边 形 的 标号 :Poly _ Id 








第 二 条 弧 所 属 的 多 边 形 的 特性 码 :Poly_ Feature( + 或 -) 











第 ”条 弧 的 出 人 特性 码 ;In__Out(+ 或 -) 








第 ”条 弧 所 属 的 多 边 形 的 标号 :Poly _ Id 





第 n 条 弧 所 属 的 多 边 形 的 特性 码 :Poly _ Feature( + 或 -) 


思 考题 
1. 编写 缓冲 区 生成 算法 程序 实现 线 状 目标 缓冲 区 的 生成 。 
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11.1 概 述 


所 谓 网 络 (network) ,是 指 线 状 要 素 相 互 连 接 所 形成 的 一 个 线 状 模式 ,是 真实 
世界 中 网 络 系统 (如 交通 网 、 通 信和 网 、 自 来 水 管 网 \ 煤 气管 网 等 ) 的 抽象 表示 ,如 道路 
网 .管线 网 .电力 网 河流 网 等 。 网 络 的 作用 是 将 资源 从 一 个 位 置 移动 到 另外 一 个 
位 置 。 资 源 在 运送 过 程 中 会 产生 消耗 ,堵塞 `\ 减 缓 等 现象 ,这 表明 网 络 系统 中 必须 
有 一 个 合理 的 体制 ,使 得 资源 能 够 顺利 地 流动 。 

网 络 功能 用 于 模拟 那些 难以 直接 量 测 的 行为 。 一 个 网 络 模型 中 ,实际 的 网 络 
要 素 由 一 套 规则 及 数学 函数 描述 。 而 基于 空间 信息 系统 的 空间 网 络 分 析 则 往往 是 
将 这 些 规 则 及 数字 上 的 描述 通过 某 些 形 式 转换 到 空间 及 属性 数据 库 中 ,以 便于 
运算 。 

网 络 分 析 是 在 线 状 模式 基础 上 进行 的 , 线 状 要 素 间 的 连接 形式 十 分 重要 ,而 这 
种 连接 以 矢量 数据 结构 最 能 描述 ,因而 一 般 系统 中 的 网 络 功能 都 以 矢量 数据 来 实 
现 。 但 是 , 栅 格 数据 模型 通常 也 能 完成 类 似 的 功能 , 极 少数 情况 下 可 能 更 为 方便 。 

网 络 分 析 是 基于 矢量 数据 的 ,其 主要 用 途 是 :选择 最 佳 路 径 .选择 最 佳 布 局 中 
心 的 位 置 。 所 谓 最 佳 路 径 是 指 从 始点 到 终点 的 最 短 距离 或 花费 最 少 的 路 线 ; 最 佳 
布局 中 心 位 置 是 指 各 中 心 所 覆盖 范围 内 任 一 点 到 中 心 的 距离 最 近 或 花费 最 小 ;网 
流量 是 指 网 络 上 从 起 点 到 终点 的 某 个 函数 ,如 运输 价格 .运输 时 间 等 。 网 络 上 任意 
点 都 可 以 是 起 点 或 终点 。 其 基本 思想 则 在 于 人 类 活动 总 是 趋向 于 按 一 定 目标 选择 
达到 最 佳 效果 的 空间 位 置 。 


11.2 网 络 数据 模型 


从 数学 的 观点 ,可 以 把 GIS 中 的 网 络 看 作 图 (graph) ,因而 可 以 利用 图 论 的 研 
究 成 果 来 解决 网 络 分 析 中 的 众多 问题 。 图 论 中 的 术语 “网 络 ”, 指 的 就 是 加 权 有 向 
图 ,但 GIS 中 涉及 的 网 络 与 数学 上 探讨 的 图 或 网 相 比较 ,存在 以 下 特殊 性 。 中 网 
线 和 结 点 的 空间 位 置 是 有 意义 的 ; @ 除了 网 线 可 以 具有 权 值 外 , 结 点 也 可 以 具有 
权 值 ,并 且 权 值 可 能 是 多 重 的 ,例如 ,网 线 可 以 有 正 向 及 道 向 阻碍 强度 需求、 容量 、 
耗费 等 多 种 权 值 ;@ 结 点 可 能 具有 转角 数据 ;@ GIS 中 的 网 络 并 不 总 是 有 向 图 。 
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对 于 水 系 、 煤 气管 道 系统 等 网 络 ,由 于 内 容 物 在 网 线 中 的 流向 是 固定 的 ,并 且 作 相 
关 分 析 时 流向 也 是 重要 依据 ,所 以 它们 应 该 作为 有 向 图 来 考察 ;但 像 城市 道路 网 这 
样 的 网 络 则 应 被 看 作 无 向 图 ,对 其 中 的 若干 单行 道 , 可 以 通过 对 网 线 阻 碍 强度 的 设 
置 来 限定 方向 。 

对 地 理 网 络 进行 地 理 分 析 和 模型 化 ,是 地 理 信息 系统 中 网 络 分 析 功 能 的 主要 
目的 。 网 络 分 析 是 运筹 学 的 一 个 基本 模型 , 它 的 根本 目的 是 研究 .筹划 一 项 网 络 工 
程 如 何 安排 ,并 使 其 运行 效果 最 好 。 这 类 问题 在 生产 社会、 经济 活动 中 不 胜 枚 举 ， 
因此 研究 此 类 问题 也 具有 重大 意义 。 

网 络 中 的 基本 组 成 部 分 和 属性 如 下 ; 

(1) 结 点 / 结 点 集 。 网 络 中 任意 两 条 线段 的 交点 为 结 点 v;。 网 络 系统 (G) 中 
所 有 结 点 的 集合 称 为 结 点 集 V(G) = 和 vi,v2ay…*,va|=[v va … mw 

网 络 中 的 结 点 ,如 车 站 、 街 道 交叉 口 港口 等 ,其 状态 属性 包括 阻力 和 需求 等 ， 
结 点 又 有 下 面 几 种 特殊 的 类 型 。 

第 一 ,站 点 ,在 路 径 选 择 中 资源 增 减 的 站 点 ,如 库房 .汽车 站 等 ,其 状态 属性 有 
要 被 运输 的 资源 需求 ,如 产品 数 。 

第 二 ,中 心 点 ,是 接受 或 分 配 资源 的 位 置 ,如 水 库 、 商 业 中 心 . 电 站 等 。 其 状态 属 
性 包括 资源 容量 ,如 总 的 资源 量 ;阻力 限额 ,如 中 心 与 链 之 间 的 最 大 距离 或 时 间 限 制 。 

第 三 ,障碍 点 ,禁止 网 络 中 链 上 流动 的 点 。 

第 四 ,拐角 点 ,出 现在 网 络 链 中 所 有 的 分 割 结 点 上 状态 属性 的 阻力 ,如 拐弯 的 
时 间 和 限制 (如 不 允许 左 拐 ) 。 

(2) 边 / 边 集 (车 边 有 方向 , 则 为 弧 / 弧 集 ,用 a; 和 A 表示 ;为 叙述 方便 ,以 下 简 
称 边 / 边 集 )。 网 络 中 任意 一 条 线段 为 边 e。 网 络 系统 (G) 中 所 有 边 的 集合 称 为 边 
集 E(G)= |ei,e2,…,enj=[e1 ez … es] 。 边 以 点 集中 的 某 两 个 点 为 起 点 
和 终点 , 即 e; = vivj , 故 边 集 也 可 以 表示 为 :E(G)= |(vi,v)/vEV,vEV|。 
若 边 的 两 个 端点 重合 ,该 边 称 为 环 ; 若 两 条 边 的 端点 是 同一 对 结 点 , 则 这 两 条 边 称 
为 重 边 或 重 弧 。 

网 络 中 的 边 ,如 网 络 中 流动 的 管线 ,如 街道 .河流 .水管 等 ,其 状态 属性 包括 阻 
力 和 需求 。 

(3) 图 。 图 是 一 个 非 空 的 有 限 结 点 与 有 限 边 的 集合 ,表示 为 G(V, 正 )。 不 考 
虑 边 的 方向 的 图 称 为 基础 图 , 记 为 G(V, 下 ); 考 虑 边 的 方向 的 图 称 为 有 向 图 , 记 为 
D(V,A); 既 没有 环 也 没有 重 弧 的 有 向 图 称 为 简单 有 向 图 。 

(4) 网 络 。 给 定 有 向 图 D(V,A) ,如 果 对 图 中 的 每 一 条 弧 a; 和 结 点 赋予 一 个 
实数 权重 w(a;) 或 , 则 称 为 赋 权 有 向 图 , 即 网 络 , 记 为 D=(V,A,W)。W 
二 WW(D)= wyw2y ;Wwn| = 二 [wt va … wm] 称 为 DD 的 权 函 数 或 权 和 矩 
阵 ;只 给 网 络 中 的 弧 同 权 或 内 给 网 络 中 的 结 点 赋 权 的 网 络 ， 分 别称 为 弧 权 网 络 或 点 
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权 网 络 。 
(5) 流 。 指 网 络 DD 中 任意 一 条 弧 a; = (wv;, wj) 的 物流 量 , 记 为 f(a;)= 方 ， 
1 (11.1) 


(v0)EA (v0) EA 

由 于 通用 性 的 不 同 以 及 网 络 分 析 功 能 的 侧重 点 不 同 , 各 个 地 理 信息 系统 的 网 
络 模型 也 不 尽 相同 ,差异 主要 体现 在 对 网 络 附属 元 素 的 分 类 和 设 定 上 。 网 络 要 素 
的 属性 除了 一 般 GIS 所 要 求 的 名 称 、 关 联 要 素 方向 .拓扑 关系 等 空间 属性 之 外 ， 
还 有 一 些 特 殊 的 非 空间 属性 。 

(1) 阻 强 : 指 物流 在 网 络 中 运 移 的 阻力 大 小 ,如 所 花 时 间 、 费 用 等 。 阻 强 一般 
与 弧 的 长 度 、 弧 的 方向 、 弧 的 属性 及 结 点 类 型 等 有 关 。 转 弯 点 的 阻 强 描述 物流 方向 
在 结 点 处 发 生 改 变 的 阻力 大 小 ,车 有 禁 左 控制 ,表示 物流 在 该 结 点 的 往 左 运 动 的 阻 
力 为 无 穷 大 或 为 负 值 。 为 了 网 络 分 析 需 要 ,一 般 要 求 不 同类 型 的 阻 强 要 统一 量 纲 。 

(2) 资源 需求 量 : 指 网 络 系统 中 具体 的 线路 \ 弧 段 、 结 点 所 能 收集 的 或 可 以 提 
供给 某 一 中 心 的 资源 量 。 如 供水 网 络 中 水 管 的 供水 量 、 城 市 交通 网 络 中 沿 某 条 街 
道 的 流动 人 口 ,货运 站 的 货 量 等 。 

(3) 资源 容量 : 指 网 络 中 心 为 满足 各 红 段 的 要 求 所 能 提供 或 容纳 的 资源 总 量 ， 
也 指 从 其 他 中 心 流 向 该 中 心 或 从 该 中 心 流向 其 他 中 心 的 资源 总 量 。 如 水 库 的 容 
量 、 货 运 总 站 的 仓储 能 力 等 。 停 靠 点 仅 在 选择 最 佳 路 线 时 使 用 ,其 属性 有 资源 需求 
量 , 正 值 表示 装载 , 负 值 表示 下 载 。 而 中 心 点 仅 在 寻求 网 络 最 佳 状态 时 使 用 ,其 属 
性 包括 资源 最 大 容量 服务 范围 (从 中 心 至 各 可 能 路 径 的 最 大 距离 ) 和 服务 延迟 数 
《在 其 他 服务 中 心 达到 某 项 临界 值 时 开始 起 动 服务 )。 

(4) 事件 :路 径 系统 中 的 某 一 路 径 的 分 段 属性 。 这 些 属性 由 用 户 定义 ,并 用 路 
径 的 度量 来 表示 。 事 件 分 为 点 事件 (与 一 个 位 置 对 应 ,用 一 个 度量 表示 )、 线 事件 
(用 两 个 度量 表示 一 个 区 段 ) 和 连续 事件 (用 一 个 度量 表示 一 个 区 段 的 开始 和 下 一 
个 区 段 的 开始 ) 三 类 。 


11.3 路径 分 析 算 法 


路 径 分 析 是 GIS 中 最 基本 的 功能 ,其 核心 是 对 最 佳 路 径 和 最 短路 径 的 求解 。 
从 网 络 模型 的 角度 看 ,最 佳 路 径 求解 就 是 在 指定 网 络 中 两 结 点 间 找 一 条 阻碍 强度 
最 小 的 路 径 。 最 佳 路 径 的 产生 基于 网 线 和 结 点 转角 (如 果 模 型 中 结 点 具有 转角 数 
据 ) 的 阻碍 强度 。 例 如 ,如 果 要 找 最 快 的 路 径 ,阻碍 强度 要 预先 设 定 为 通过 网 线 或 
在 结 点 处 转弯 所 花费 的 时 间 ;如果 要 找 费 用 最 小 的 路 径 ,阻碍 强度 就 应 该 是 费用 。 
当 网 线 在 顺 、 逆 两 个 方向 上 的 阻碍 强度 都 是 该 网 线 的 长 度 ,而 结 点 无 转角 数据 或 转 
角 数 据 都 是 零 时 ,最 佳 路 径 就 成 为 最 短路 径 。 在 某 些 情况 下 ,用 户 可 能 要 求 系统 能 
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一 次 求 出 所 有 结 点 对 间 的 最 佳 路 径 ,或 者 要 了 解 两 结 点 间 的 第 二 、 第 三 乃至 第 K 
条 最 佳 路 径 。 

另 一 种 路 径 分 析 功 能 是 最 佳 游历 方案 的 求解 .网线 最 佳 游历 方案 求解 ,是 给 定 
一 个 网 线 集合 和 一 个 结 点 ,求解 最 佳 路 径 ,使 之 由 指定 结 点 出 发 至 少 经 过 每 条 网 线 
一 次 而 回 到 起 始 结 点 。 结 点 最 佳 游历 方案 求解 , 则 是 给 定 一 个 起 始 结 点 一 个 终止 
结 点 和 若干 中 间 结 点 ,求解 最 佳 路 径 ,使 之 由 起 点 出 发 遍历 全 部 中 间 结 点 而 达 
终点 。 

(1) 静态 求 最 佳 路 径 : 由 用 户 确 定 权 值 关系 后 , 即 给 定 每 条 弧 段 的 属性 , 当 需 
求 最 佳 路 径 时 , 读 出 路 径 的 相关 属性 , 求 最 佳 路 径 ; 

(2) 动态 分 段 技 术 : 给 定 一 条 路 径 由 多 段 联系 组 成 ,要 求 标 注 出 这 条 路 上 的 千 
米 点 或 要 求 定 位 某 一 公路 上 的 某 一 点 ,标注 出 某 条 路 上 从 某 一 于 米 数 到 另 一 千 米 
数 的 路 段 ; 

(3) N 条 最 佳 路 径 分 析 : 确 定 起 点 终点 , 求 代价 较 小 的 几 条 路 径 , 因 为 在 实践 
中 往往 仅 求 出 最 佳 路 径 并 不 能 满足 要 求 ,可 能 因为 某 种 因素 不 走 最 佳 路 径 ,而 走 近 
似 最 佳 路 径 ; 

(4) 最 短路 径 :确定 起 点 ` 终 点 和 所 要 经 过 的 中 间 点 .中 间 连 线 , 求 最 短路 径 ; 

(5) 动态 最 佳 路 径 分 析 :实际 网 络 分 析 中 权 值 是 随 着 权 值 关 系 式 变化 的 ,而 且 
可 能 会 临时 出 现 一 些 障 碍 点 ,所 以 往往 需要 动态 地 计算 最 佳 路 径 。 


11.3.1 单 源 点 的 最 短路 径 


已 知 有 向 带 权 图 (简称 有 向 网 ) G = (V, 巨 ) , 找 出 从 某 个 源 点 ;EV 到 V 中 其 
余 各 顶点 的 最 短路 径 。 

E. W. Dijkstra 提出 了 按 路 径 长 度 递增 的 次 序 产生 最 短路 径 的 算法 。 即 若 按 
长 度 递增 的 次 序 生成 源 点 到 其 他 顶点 的 最 短路 径 , 则 当前 正在 生成 的 最 短路 径 上 
除 终点 外 ,其 余 顶点 的 最 短路 径 均 已 生成。 

算法 的 基本 思想 如 下 ; 

假设 网 络 G(V, EE),V 为 网 络 中 所 有 结 点 的 集合 ,天 为 网 络 中 所 有 边 的 集 
合 ,* 为 起 始 结 点 ,S 为 已 计算 出 最 短 距离 的 结 点 集合 , 则 V-S 就 是 最 短 距 离 待 求 
解 的 结 点 集合 。 

第 一 步 :初始 化 

初始 时 ,只 有 起 始 结 点 * 的 最 短 距离 是 已 知 的 , 故 S= |s1; 

第 二 步 :计算 未 知 点 的 最 短路 径 

从 当前 V-S 中 选择 最 短 距离 的 结 点 来 扩充 S ,以 保证 算法 按 路 径 长 度 递增 的 
次 序 产生 顶点 的 最 短路 径 。 根 据 这 种 思想 ,当前 最 短 距离 最 小 的 未 知 结 点 的 最 
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短路 径 是 : 
s ,已 知 结 点 1, 已 知 结 点 2,…… ,已 知 结 点 n ,未知 结 点 上 
则 距离 为 :s 到 已 知 结 点 2” 的 最 短 距离 + < 已 知 结 点 ,未 知 结 点 >> 边 长 。 
注意 当 将 & 扩充 至 S 后 , V-S 的 估计 距离 可 能 因此 而 减 小 ,此 时 必须 调整 相 
应 未 知 结 点 的 估计 距离 。 
第 三 步 :重复 第 二 步 。 仅 当 V-S 中 所 有 结 点 的 最 短 距 离 为 或 为 空 时 ,s 到 
所 有 结 点 的 最 短路 径 已 求解 完毕 。 算 法 的 时 间 复 杂 度 为 O(n?)。 


单 源 最 短路 径 的 Dijkstra 算法 。 


使 用 二 叉 堆 挑选 

总 复杂 度 0((e+ v)logv) 

const 
maxn = 100; 

type 
link = node; /邻接 表 类 型 
node = record 


VvV,w :integer; 


next :link; 
end; 
htype = record XW/ 堆 节点 
Vv,d,p :integer; 
end; 
var 

n,s,hl : integer; /顶点 数 ; 源 点 ; 堆 长 度 
heap :array[ 0. . maxn |of htype; 
hpos :array[ 1. . mazmjof integer; /hpos[v] :顶点 v 在 堆 中 的 位 置 
9 :array[ 1. .mazmjof link; /邻接 表 


procedure insert(u,v,w:integer); /将 权 值 为 w 的 边 (u,v) 插 入 到 邻接 表 
x :link; 
begin 
new(x); 
XV = VS KW: = Ws 
x.next: =glu]; glu]:=x; 


end; 
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procedure init; /初始 化 
Var 
U,V,W :integer; 
begin 
assign( jnput，g. in ) ;reset( input); 
readln(n, s); 
while not eof do 
begin 
readln(u,v,w); 
insert(u,v,w);insert(v,u,w); 
end; 


end; 


procedure swap(a,b: integer); WH 交换 堆 中 下 标 为 a,b 的 节点 
Dain 
heap[ 0]: = heap[a|;heap[al]: = heap[b|];heap[b]: = heap[0|; 
hpos[ heap[a].v]: =a;hpos[heap[b].v]: = bi; 


end; 


procedure decrease( i: integer); / 减 小 键 值 并 恢复 堆 性 质 
begin 
while (i< >1)and(heap[i].d<heap[i div 2].d) do 
begin 
swap(i,i div 2); 
i:=1div2; 
end; 
end; 


procedure heapfy; /恢复 堆 性 质 
var 
i :integer; 
begin 
i: =2; 
while i< =hl do 
begin 
if(i<hl)and(heap[ i+1].d< heap[lil].d) then inc(i); 
if heap[i].d< heap[i div 2].d then 
begin 
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swap(i,idiv2); 
i:=ix2; 
end 
else break 
end; 
end; 
procedure relax(u,v,w: integer); /松弛 操作 
begin 
if w+ heap[ hpos[u]j]. d< heap[hpos[v]j].d then 
begin 
heap[hpos[v]].p: =u; 
heap[hpos[v]j.d: = w+ heap[ hpos[u]].d; 
decrease(hpos[v]); 
end; 
end; 
procedure dijkstra; / 主 过 程 
var 
u :integer; 
p :link; 
begin 
for u: =1 to n do /初始 化 堆 
begin 
heap[uj.v: = ui 
heap[u].d: = maxint; 
hposlu]: = ui 
end; 
heap[ s]. p: = s;heap[ s].d: = 0; swap(1,s); 
hi:=n; 
while hl>0 do 
begin 
u: = heap[1].v; 
Swap(1,hl);dec(hl);heapfy; /将 堆 的 根 节点 移出 堆 并 恢复 堆 性 质 
p:=g[u]; 
while p< > nil do 
begin 
if hpos[p.v]<= hl then relax(u,p.v,p.w);  V 对 与 u 邻 接 且 在 堆 中 的 顶 
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点 进行 松弛 操作 
p: = Pp. next; 
end; 
end; 
end; 


procedure path( i: integer); 

begin 
if heap[ hpos[ i]]. p< >s then path( heap[ hpos[ i]]. p); 
write( 一 一 > ,i); 

end; 


procedure show; 
Var 
i :integer; 
begin 
for i:=1tondo 
begin 
write(i:3, :;’,heap[ hpos[i]].d:3, ;’,s); 
path( i); /递归 输出 路 径 
writeln; 


end 


dijkstra; 
Show; 


end. 
11.3.2 单 目 标 最 短路 径 问题 


找 出 网 络 中 每 一 结 点 v 到 指定 结 点 的 最 短路 径 。 只 需 将 图 中 每 条 边 反 向 ， 
即 可 将 该 问题 转变 为 单 源 最 短路 径 问 题 。 


11.3.3 单 结 点 对 间 最 短路 径 问 题 


对 于 某 对 结 点 x 和 ww, 找 出 从 wu 到 = 的 一 条 最 短路 径 。 求 解 以 x 为 起 始 结 点 
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的 单 源 最 短路 径 问题 , 则 得 到 该 问题 的 求解 ,两 问题 的 时 间 复 杂 度 相同 。 
11.3.4 多 结 点 对 间 最 短路 径 问题 


对 网 络 中 每 对 结 点 求解 其 最 短路 径 ,实际 上 转化 成 对 单 源 点 最 短 问题 的 处 理 ， 
即 调用 多 次 该 算法 ,当然 也 可 以 使 用 Floyd 算法 。 es 时 间 复 杂 度 均 
为 O(n3)。 
Floyd 算法 仍 从 图 的 带 权 邻接 矩阵 出 发 ,其 基本 思想 是 : 
假设 求 从 顶点 v; 到 w; 的 最 短路 径 。 如 果 从 vi 到 vw 有 弧 , 则 从 vw; 到 w 存在 
一 条 长 度 为 cost[ wi, wv] 的 路 径 , 该 路 径 不 一 定 是 最 短路 径 , 尚 需 进 行 n 次 试探 。 
首先 考虑 路 径 (w;, v1, wv) 是 否 存 在 ( 即 判 别 弧 (w;, vi) 和 (wi,w;) 是 否 存 在 )。 如 果 
存在 , 则 比较 (vi, wj) 和 (vi, v1, vj) 的 路 径 长 度 取 长 度 较 短 者 为 从 wv; 到 vw 的 中 间 
顶点 的 序号 不 大 于 1 的 最 短路 径 。 假 如 在 路 径 上 再 增加 一 个 顶点 vw, 也 就 是 说 ， 
如 果 (vw;,… ,v2) 和 (ws,… ,wv;) 分 别 是 当前 找到 的 中 间 顶 点 的 序号 不 大 于 1 的 最 短 
路 径 , 那 么 (vw;,…,v,,… ,vj) 就 有 可 能 是 从 v; 到 w; 的 中 间 顶 点 的 序号 不 大 于 2 的 
最 短路 径 。 将 它 和 已 经 得 到 的 从 vw; 到 中 间 顶 点 序号 不 大 于 1 的 最 短路 径 相 比 
较 , 从 中 选 出 中 间 顶 点 的 序号 不 大 于 2 的 最 短路 径 之 后 ,再 增加 一 个 顶点 v3, 继 续 
ee 在 一 般 情 况 下 ,者 (vi,…, vi) 和 (vi,…, vj;) 分 别 是 从 wv; 到 
和 从 vs 到 w; 的 中 间 顶 点 的 序号 不 大 于 & 一 1 的 最 短路 径 , 则 将 (v;,…, vi ，… 
i 径 得 到 的 从 ww 到 且 中 间 顶 点 序号 不 大 于 -1 的 最 短路 径 相 比 较 ,其 长 
度 较 短 者 便 是 从 v; 到 w; 的 中 间 顶 点 的 序号 不 大 于 & 的 最 短路 径 。 这 样 ,在 经 过 ” 
次 比较 后 ,最 后 求 得 的 必 是 从 vw; 到 vw 的 最 短路 径 。 按 此 方法 ,可 以 同时 求 得 各 对 
顶点 间 的 最 短路 径 。 
现 定义 一 个 n 阶 方 阵 序列 。 
AW,AD 0 ,A®) An) 
其 中 
ALi,j]= cost[i,j] 
ARTi,j]=min| A DTi,j], A DIi, gk]+AL DE,I]} 1<k<n 
从 上 述 计 算 公 式 可 见 , A 人 [i, 站 是 从 vw; 到 w 的 中 间 顶 点 的 序号 不 大 于 1 的 
最 短路 径 的 长 度 ;A%)[i,j] 是 从 vw; 到 vw 的 中 间 顶 点 的 序号 不 大 于 k 的 最 短路 径 
的 长 度 ,442[, 门 就 是 从 vw; 到 w 的 最 短路 径 的 长 度 。 


11.3.5 次 短路 径 求 解 算法 


在 某 些 情况 下 ,除了 要 求 出 两 个 给 定点 之 间 的 最 短路 径 之 外 ,还 可 能 要 求 出 这 
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两 点 之 间 的 次 最 短路 径 、 第 3 短路 径 …… 及 第 & 最 短路 径 。 可 以 在 求 出 第 1 最 短 
路 径 Pi 之 后 ,用 枚 举 法 求 出 与 Pl 有 尽 可 能 多 公共 边 的 次 最 短路 径 P,。 

算法 的 基本 思路 是 :假定 第 一 最 短路 径 Pi 包含 了 NN 条 有 向 弧 ,每 次 删除 其 中 
的 一 条 弧 , 即 得 到 N 个 与 原 网 络 只 有 一 弧 之 差 的 新 网 络 。 按 原 最 短路 径 算法 分 别 
求解 这 NN 个 新 网 络 的 最 短路 径 , 然 后 比较 这 N 条 最 短路 径 , 其 中 最 短 的 那 条 即 为 
所 求 的 次 最 短路 径 。 依 次 进行 ,可 以 分 别 求解 第 3 短路 径 …… 及 第 & 最 短路 径 。 


11.4 最 佳 路 径 算法 


所 谓 最 佳 路 径 ,是 指 网 络 两 结 点 之 间 阻 抗 最 小 的 路 径 。“ 阻 抗 最 小 ”有 多 种 理 
解 ,如 基于 单 因素 考虑 的 时 间 最 短 、 费 用 最 低 、 风景 最 好 、 路 况 最 佳 .过 桥 最 少 \ 收 费 
站 最 少 \ 经 过 乡村 最 多 等 ,和 基于 多 因素 综合 考虑 的 风景 最 好 且 经 过 乡村 较 多 ,或 
时 间 较 短 、 路 况 较 佳 \ 且 收费 站 最 少 等 。 最 短路 径 问 题 是 最 优 路 径 问 题 的 一 个 单 因 
素 特例 , 即 认为 路 径 最 短 就 是 最 优 。 最 佳 路 径 的 求解 算法 有 几 十 种 ,如 基于 贪心 策 
略 的 最 近 点 接近 法 、 最 优 插入 法 ,基于 启发 式 搜索 策略 的 分 枝 算法 ,基于 局 部 搜索 
策略 的 对 边 交换 调整 法 , 以 及 广泛 采用 的 Dijkstra 算法 等 。 这 里 分 别 介绍 基于 最 
大 可 靠 性 和 最 大 容量 的 最 优 路 径 。 


11.4.1 最 大 可 靠 路 径 


设 网 络 D(V, A) 中 的 每 条 a;(w;, wi) 的 完好 概率 为 p; ,D 中 的 任意 一 条 路 
径 P, 其 完好 概率 为 
p(P) = ll ps (11.2) 


则 网 络 D(V, A) 中 所 有 (wv,, wv) 路 径 中 的 完好 概率 最 大 的 路 径 为 (wv,, v,) 的 最 大 
可 靠 路 径 。 

利用 最 短路 径 算法 也 可 以 求解 最 大 可 靠 路 径 。 做 法 为 

定义 网 络 D(V,A) 中 的 每 条 弧 a;(v;,v) 的 权 为 

wi =— lnps (11.3) 

因为 0 志 p; 志 1, 所 以 wj 二 0。 从 而 可 以 用 前 述 的 Dijkstra 算法 求 出 关于 权 
ws 的 最 短路 径 。 由 于 >) w; = - In( 了 | pi;) ,所 以 ,关于 权 wi 的 最 短路 径 就 是 
(w,, vi) 的 最 大 可 靠 路 径 , 其 完好 概率 为 exp (- > wi) 。 
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11.4.2 最 大 容量 路 径 


设 网 络 D(V ,E,W) 中 的 任意 一 条 路 径 P 的 容量 定义 为 该 路 径 中 所 有 弧 的 
容量 cj 的 最 小 值 , 即 
c(P)=min|c;|,c; EE(P) (11.4) 
则 网 络 D(V ,A) 中 所 有 (wv, wv,) 路 径 中 的 容量 最 大 的 路 径 即 为 (wv,, vw,) 的 最 大 容 
量 路 径 。 同 样 ,可 以 将 网 络 中 每 条 边 或 弧 的 权 值 定义 为 通过 该 边 或 弧 的 时 间 , 就 可 
以 求 出 时 间 最 优 路 径 ; 若 定义 为 该 弧 的 费用 , 则 所 求 出 的 为 费用 最 优 路 径 。 最 优 路 
径 的 求解 有 多 种 形式 (图 11.1) ,两 点 间 最 优 路 径 、 多 点 间 指 定 顺 序 的 最 优 路 径 、 多 
点 间 最 优 顺序 最 优 路 径 、 经 指定 点 后 回 到 起 点 的 最 优 路 径 等 。 





(a) 两 点 间 最 优 路 径 





(0) 多 点 问 最 优 顺序 最 优 路 径 (d) 经 指定 点 后 回 到 起 点 的 最 优 路 径 


图 11.1 最 优 路 径 的 几 种 典型 形式 
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11.5 连通 性 分 析 算 法 


人 们 往往 需要 知道 从 某 一 结 点 或 网 线 出 发 能 够 到 达 的 全 部 结 点 或 网 线 。 这 一 
类 问题 称 为 连通 分 量 求解 。 另 一 连通 分 析 问 题 是 最 少 费 用 连通 方案 的 求解 , 即 在 
耗费 最 小 的 情况 下 使 得 全 部 结 点 相互 连通 。 

连通 性 是 衡量 网 络 复杂 性 的 量度 ,常用 y 指数 和 a 指数 计算 。 其 中 , y 指数 等 
于 给 定 空 间 网 络 体 结 点 连 线 数 与 可 能 存在 的 所 有 连 线 数 之 比 ;a 指数 用 于 衡量 环 
路 , 结 点 被 交替 路 径 连接 的 程度 称 为 a 指数 ,等 于 当前 存在 的 环 路 数 与 可 能 存在 
的 最 大 环 路 数 之 比 。 连 通 分 析 问 题 对 应 于 图 的 生成 树 求解 。 求 连通 分 量 往往 采用 
深度 优先 遍历 或 广度 优先 遍历 形成 深度 或 广度 优先 生成 树 。 最 小 费用 连通 方案 问 
题 就 是 求解 图 的 最 优生 成 树 ,一 般 使 用 Prim 算法 或 Kruskal 算法 。 


11.5.1 Prim 算法 


设 T=(U,T(E)) 是 存放 MST( 最 小 生成 树 ) 的 集合 。 所 谓 最 小 生成 树 是 指 
对 于 连通 的 带 权 图 (连通 网 )G , 权 最 小 的 生成 树 。 

(1) 在 图 G=(V, EF) (V 表示 顶点 ,EF 表示 边 ) 中 ,从 集合 V 中 任 取 一 个 项 
点 (例如 取 顶 点 vo) 放 入 集合 U 中 ,这 时 U= {vo} ,集合 T(E) 为 空 。 

(2) 从 vo 出 发 寻找 与 U 中 顶点 相 邻 ( 另 一 顶点 在 V 中 ) 权 值 最 小 的 边 的 另 
一 顶点 ui ,并 使 vi 加 入 U。 即 QU = io,vij ,同时 将 该 边 加 入 集合 T(E) 中 。 

(3) 重复 (2) ,直到 U= V 为止 。 

这 时 T(E) 中 有 n 一 1 条 边 ,T= (U，,， T(E)) 就 是 一 棵 最 小 生成 树 。 


# include < stdio. h> 
# define inf 9999 
#define max 40 
prim( int g[ J[ max], int n) 
| 
int lowcost[ max] ,closest[max|; 
int 1,j,k,min; 
for(i=2;i< =n;i+ +) /An 个 顶点 ,n-1 条 边 
| 
lowcost[i] = g[1][i]; /初始 化 
closest[i] = 1; /顶点 未 加 入 到 最 小 生成 树 中 
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lowcost[1] =0; /标志 项 点 1 加 入 U 集 合 
for(i=2;i< =n;i+ +) /形成 na- 1 条 边 的 生成 树 
| 
min= inf; 
k=0; 
for(j=2;j< =n;j+ +) /寻找 满足 边 的 一 个 顶点 在 U, 另 一 个 顶点 在 V 的 最 
小 边 
if((lowcost[j]<min)&&(lowcost[j]! =0)) 
| 
min = lowcost[j]; 
k= j; 
} 
printf(“(%d, %d)%d\t ,closest[k|,k,min); 
lowcost[k] = 0; A 顶点 k 加 入 U 
for(j=2;j< =n;j++) /修改 由 顶点 k 到 其 他 顶点 边 的 权 值 
if(glk][j]< 1owcost[j]) 
| 
lowcost[ j] = gfk][j]; 
closest[j] =k; 


printf( \n); 
| 
} 


int adjg( int g[ J[max]) /建立 无 向 图 
L 
int n,e,i,j,k,v1,v2,weight; 
printf(“ 输 入 顶点 个 数 , 边 的 条 数 :”); 
Scanf( %d, %d ,Sn,&e); 
for(i=1;i< =n;i++) 
for(j=1;j< =n;j++) 1 
gLi][j] = inf; /初始 化 和 矩阵 ,全 部 元 素 设 为 无 穷 大 
for(k=1;k< =e;k++) 
| 
printf(“ 输 入 第 %d 条 边 的 起 点 ,终点 , 权 值 :“,k); 
Scanf( %d, %d, %d ,&vl,&v2, Sweight); 
g[lv1 [v2] = weight; 
gLv2][v1] = weight; 
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void prg(int g[ |[ max], int n) /输出 无 向 图 的 邻接 矩阵 
| 
int 1,j; 
for(i=0;i< =n;i++) 
printf(“ %d\t ,i); 
for(i=1;i< =n;i++) 
| 
printf( \n%d\t ,i); 
for(j=1;j< =n;j++) 
printf((g[il[j] == inf)? \t:"%d\t ,gli)[j)); 
| 
Printf( \n); 


| 


main() 

| 
int gL max|[max] ,n; 
n=adjg(g); 
printf(“ 输 入 无 向 图 的 邻接 矩阵 :\ 0 ); 
prg(g,n); 
printf(“ 最 小 生成 树 的 构造 : \n); 
prim(g,n); 


11.5.2 Kruskal 算法 


设 T=(U,T(E)) 是 存放 MST( 最 小 生成 树 ) 的 集合 。 

(1) 设 n 阶 无 向 连通 带 权 图 G = (V，E), 有 m 条 边 。 不 妨 设 G 中 没有 环 
(否则 ,可 以 将 所 有 的 环 先 删 去 ), 将 mm 条 边 按 权 从 小 到 大 顺序 排列 , 设 为 el， 
ee 

(2) 取 ei 在 工 中 ,然后 核 次 检查 e2,e3,…,em。 若 e 与 工 中 的 边 不 能 构成 回 
路 , 则 取 。 在 工 中 ,否则 弃 去 。。 

(3) 算法 停止 时 得 到 的 工 为 G 的 最 小 生成 树 。 
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该 算法 的 时 间 复 杂 度 为 O(elge) 。Kruskal 算法 的 时 间 主 要 取决 于 边 数 。 它 较 
适合 于 稀 玖 图 。 


# include stdio, hk 
# include stdlib. hy 
#define N 10 
## define MAXCOST 100 
typedef struct wedge 
| int start; 
int end; 
int weight; 
int flag; 
1 Wi; 
void klusker( ); 
main( ) 
| int i,]j; 
klusker( ); 
getch( ); 
| 
void klusker( ) 
| W b[N]; 
int 1, j,k; 
int n,m; 
int f[N]; 
int 七; 
int min; 
for(i=1;i< =N;i++) 
f[i] =0; 
printf(” input the nodes number:” ); 
scanf(” %d’,&n); 
printf( input the wedge info: Nm ); 
printf( “input the wedge number: Nm ); 
scanf( %d ,Sm); 
for(i=1;i< =m;i++) 
| printf(’the % dth: \n ,i); 
Printf( “the start node:”); 
scanf(” %d ,gb[il]. start); 
printf(“the end node:”); 
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scanf(“% df ,Sbli].end)i 
printf( the weight: Nm ); 
scanf( %d ,gb[i].weight); 
b[il. flag=0; 
} 
k=0; 
while(k<n) 
| min = MAXCOST; 
while(j< =N) 
L if(b[j].flag! =1) 
|! if(min>b[j].weight&&(b[j]. start =0||b[j].end= = 0)) 
| min= b[j]. weight; 
t=)j; 
| 
j++; 
| 
f[b[t]. start] = 1; 
fLbltj.end] = 1; 
printft("%d- 一 一 >g%dNnm,b[tj.start,blt]j,end); 
blt]. flag=1; 
k++; 


11.6 资源 分 配 算法 


资源 分 配 就 是 为 网 络 中 的 网 线 和 结 点 寻找 最 近 ( 这 里 的 远近 是 按 阻 碍 强度 的 
大 小 来 确定 的 ) 的 中 心 (资源 发 散 或 汇集 地 )。 例 如 ,资源 分 配 能 为 城市 中 的 每 一 条 
街道 上 的 学 生 确定 最 近 的 学 校 ,为 水 库 提供 其 供水 区 等 。 资 源 分 配 是 模拟 资源 如 
何在 中 心 ( 学 校 ,消防 站 \ 水 库 等 ) 及 其 周围 的 网 线 ( 街 道 , 水 路 等 ) . 结 点 (交叉 路 口 、 
汽车 中 转 站 等 ) 间 流动 的 。 根 据 中 心 容量 以 及 网 线 和 结 点 的 需求 将 网 线 和 结 点 分 
配给 中 心 ,分 配 是 沿 最 佳 路 径 进行 的 。 当 网 络 元 素 被 分 配给 某 个 中 心 时 ,该 中 心 拥 
有 的 资源 量 就 依据 网 络 元 素 的 需求 而 缩减 ,当中 心 的 资源 耗 尽 ,分 配 就 停止 。 用 户 
可 以 通过 赋予 中 心 的 阻碍 限度 来 控制 分 配 的 范围 。 

资源 分 配 网 络 模型 由 中 心 点 (分 配 中 心 ) 及 其 状态 属性 和 网 络 组 成 。 分 配 有 两 
种 方式 ,一 种 是 由 分 配 中 心 向 四 周 输出 , 男 一 种 是 由 四 周 向 中 心 集中 。 这 种 分 配 功 
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能 可 以 解决 资源 的 有 效 流动 和 合理 分 配 。 其 在 地 理 网 络 中 的 应 用 与 区 位 论 中 的 中 
心地 理论 类 似 。 在 资源 分 配 模型 中 ,研究 区 可 以 是 机 能 区 ,根据 网 络 流 的 阻力 等 来 
研究 中 心 的 吸引 区 ,为 网 络 中 的 每 一 连接 寻找 最 近 的 中 心 , 以 实现 最 佳 的 服务 ,还 
可 以 用 来 指定 可 能 的 区 域 。 

资源 分 配 模 型 可 用 来 计算 中 心地 的 等 时 区 .等 交通 距离 区 .等 费用 距离 区 等 。 
可 用 来 进行 城镇 中 心 、 商 业 中 心 或 港口 等 地 的 吸引 范围 分 析 , 以 用 来 寻找 区 域 中 最 
近 的 商业 中 心 ,进行 各 种 区 划 和 港口 腹地 的 模拟 等 。 

假设 研究 区 域内 有 2” 个 需求 点 和 个 供应 点 ,每 个 需求 点 的 权重 (需求 量 ) 为 
wistjy， 和 号 。 分 别 为 供应 点 ; 对 需求 点 i 提供 的 服务 和 两 者 之 间 的 距离 。 如 果 
供应 点 的 服务 能 够 覆盖 到 区 域内 的 所 有 需求 点 , 则 


> = w, (i = 1,.…,n) (11.5) 
若 规定 每 个 需求 点 只 1 分 配给 离 其 最 近 的 一 个 供应 点 , 则 有 


ee i 
tj=0 其 他 诸 情 况 
网 络 整 体 的 目标 方程 必 满足 : 
> = mmn (11.7) 
其 中 ,c 可 以 有 以 下 几 种 基本 理解 (图 11.2)。 
(a) 总 距离 最 小 (b) 均 在 某 一 理想 服务 半径 内 (0) 服务 范围 尽 可 能 大 
图 11.2 P- 中 心 模型 的 基本 形式 
(1) 当 要 求 所 有 需求 点 到 供应 点 的 距离 最 小 时 : 
ci = wids (11.8) 
(2) 二 本 家 在 本 点 均 在 某 一 理想 服务 半径 之 内 时 : 
widi djs 
YW | +oo di>s ee 


(3) 当 要 求 所 有 供应 点 的 服务 范围 尽 可 能 最 大 , 即 新 增 需 求 点 的 代价 最 低 时 : 
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0 d;s 
cs; -| (11.10) 


Ti djy>s 
以 上 是 资源 分 配 问题 的 基本 数学 表达 。 在 运筹 学 里 ,可 以 通过 线性 规划 理论 
与 方法 求 得 其 最 佳 解 。 但 有 一 个 问题 , 即 当 网 络 结 点 众多 时 (如 超过 100 个 点 ), 则 
计算 量 和 需求 量 均 非常 大 。 
网 络 分 析 与 图 论 和 运筹 学 关系 密切 , 它 通 过 研究 网 络 各 组 成 部 分 的 状态 ,来 分 
析 、 研 究 和 模拟 资源 在 网 络 上 的 流动 、 分 配 情况 ,进而 实现 对 网 络 结构 及 资源 分 配 
等 的 优化 。GIS 中 的 网 络 分 析 在 现实 世界 中 纷繁 复杂 ,虽然 图 论 研 究 中 得 到 的 大 
量 算 法 可 以 为 其 提供 有 力 的 理论 支持 ,但 还 是 和 图 这 种 理想 的 数学 模型 存在 一 定 
的 差距 ,因而 对 网 络 分 析 产生 很 大 影响 。 另 外 ,我们 往往 讨论 较 多 的 是 组 合 最 优化 
问题 ,在 实际 的 应 用 中 还 会 碰 到 如 系统 稳定 性 分 析 、 运 行 状 态 分 析 等 情况 。 所 以 ， 
在 将 图 论 算法 进行 推广 修正 以 适应 网 络 分 析 需 要 的 同时 ,还 应 该 考虑 寻找 更 具 广 
泛 性 的 数学 模型 和 数学 方法 。 例 如 ,可 以 将 图 论 与 系统 论 相 结合 ,把 网 络 看 作 一 个 
系统 ,将 网 络 元 素 作为 系统 单元 ,用 终端 图 以 及 包含 终端 变量 的 一 组 一 阶 微分 方程 
或 一 组 代数 联 立 方程 来 表示 网 络 ,求解 相关 问题 。 


思 考 题 


1. 编写 Dijkstra 算法 程序 实现 单 点 源 最 短路 径 的 计算 。 
2. 编写 Prim 算法 程序 实现 求解 图 的 最 优生 成 树 。 
3. 编写 Kruskal 算法 程序 实现 求解 图 的 最 优生 成 树 。 


第 12 帝 地 形 分 析 算 法 
12.1 数字 地 面 模型 的 生成 算法 


数字 地 面 模型 (Digital Terrain Model, DTM) 是 定义 于 二 维 区 域 上 的 一 个 有 限 
项 的 矢量 序列 , 它 以 离散 分 布 的 平面 点 来 模拟 连续 分 布 的 地 形 。 按 平面 上 等 间距 
规则 采样 ,或 内 插 所 建立 的 数字 地 面 模 型 , 称 为 基于 规则 网 格 的 数字 地 面 模型 ,可 
以 写成 以 下 形式 : 

DTM= (2;,;| , i=1,2,3, ,mC—1,m;)=1,2,3,.…,n—1,n 
式 中 ,2 为 栅 格 (i,;) 上 的 地 面 属性 数据 ,包括 土地 权 属 土壤 类 型 .土地 利用 等 。 
当 该 属性 为 海拔 高 程 时 , 则 该 模型 即 为 数字 高 程 模 型 (Digital Elevation Model， 
DEM)。 下 面 主要 以 DEM 为 例 介绍 数字 地 面 模型 的 相关 算法 。 


12.1.1 基于 离散 点 的 DEM 规则 网 格 的 生成 


基于 规则 网 格 的 数字 地 面 模型 首先 对 研究 区 域 在 二 维 平面 上 进行 格 网 划分 
( 格 网 大 小 取决 于 DEM 应 用 目的 ) ,形成 覆盖 整个 区 域 的 格 网 空间 结构 ,然后 利用 
分 布 在 格 网 点 周围 的 地 形 采 样 点 内 插 计算 格 网 点 的 高 程 值 ,最 后 按 一 定 的 格式 输 
出 ,形成 该 地 区 的 格 网 DEM。 图 12.1 表示 了 格 网 DEM 的 建立 过 程 。 

由 图 12.1 中 可 看 出 ,DEM 建立 的 关键 环节 是 格 网 点 上 值 的 内 插 计 算 。 从 
DEM 概念 提出 至 今 ,经 过 多 年 的 发 展 和 完善 ,已 经 提出 多 种 高 程 内 插 方 法 。DEM 
内 插 方法 并 没有 统一 的 标准 ,例如 从 数据 分 布 规 律 来 讲 ,有 基于 规则 分 布 数据 的 内 
插 方法 、 基 于 不 规则 分 布 的 内 插 方法 和 适合 于 等 高 线 数据 的 内 插 方法 等 ; 按 内 插 点 
的 分 布 范 围 ,内 插 方法 分 为 整体 内 插 、 局 部 内 插 和 逐 点 内 插 法 ;从 内 插 函 数 与 参考 
点 的 关系 方面 ,又 分 为 曲面 通过 所 有 采样 点 的 纯 二 维 插值 方法 和 曲面 不 通过 参考 
点 的 曲面 拟 合 插值 方法 ;从 内 插曲 面 的 数学 性 质 来 讲 ,有 多 项 式 内 插 、 样 条 内 插 、 最 
小 二 乘 配置 内 揪 等 内 插 函 数 ;从 对 地 形 曲面 理解 的 角度 ,内 插 方法 有 克 立 金 法 、 多 
层 曲 面倒 加 法 、 加 权 平 均 法 、 分 形 内 插 等 ; 表 12.1 对 各 种 分 类 方法 进行 了 简要 的 总 
结 和 归纳 。DEM 内 播 的 根本 是 对 地 形 曲面 特征 的 认识 和 理解 ,具体 到 方法 上 , 则 
是 内 插 点 邻 域 范围 的 确定 . 权 值 确定 方法 ( 自 相 关 程 度 ) 内 揪 函 数 的 选择 等 方面 的 
问题 。 
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不 规则 分 布点 规则 分 布 等 高 线 分 布 












对 每 一 格 网 点 求 取 
格 网 点 高 程 


图 12.1 格 网 DEM 建立 流程 


表 12.1 DEM 内 插 分 类 方法 


| 规则 分 布 内 插 方法 
数据 分 布 不 规则 分 布 内 插 方 法 
等 高 线 数据 内 插 方法 
整体 内 插 方法 
内 插 范 转 局 部 内 插 方法 
逐 点 内 插 方 法 
内 插曲 面 与 参考 点 | 纯 二 维 内 插 方 法 
关系 曲面 拟 合 内 插 方 法 





























DEM 内 插 





线性 插值 
多 项 式 内 插 方法 双 线 性 插值 


高 次 多 项 式 插值 

内 插 函 数 性 质 祥 条 内 回 方 法 

有 限 元 内 插 方 法 
最 小 二 乘 配 置 内 插 方 法 
克 里 金 内 插 方法 
多 层 曲 面 疲 加 内 插 方法 
加 权 平 均值 内 插 方 法 . 
分 形 内 插 方 法 


由 于 每 一 种 内 插 方法 都 有 其 自身 的 特点 和 适用 范围 ,因此 了 解 方法 的 特点 是 
本 质 所 在 。 有 关内 插 方 面 的 内 容 参 见 本 书 第 8 章 空间 数据 内 插 。 























地 形 特 征 理 解 
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12.1.2 基于 不 规则 三 角 网 的 DEM 生成 


基于 不 规则 三 角 网 的 数字 高 程 模型 (Based on Triangulated Irregular Network 
DEM ,简写 为 Based on TIN DEM ,俗称 TIN) 就 是 用 一 系列 互 不 交 又 、 互 不 重合 的 
连接 在 一 起 的 三 角形 来 表示 地 形 表面 。TIN 是 DEM 的 又 一 个 主要 数据 模型 ， 
TIN 的 特点 在 其 字面 意思 中 表露 无 遗 (图 12.2 )。 


@ 
@ Ei 附加 高 程 





不 规则 分 布 数据 点 
图 12.2 TIN 的 生成 
有 关 TIN 的 生成 算法 参见 第 9 章 TIN 与 Voronoi 图 分 析 。 


12.1.3 DEM 数据 结构 的 相互 转换 


不 同 结 构 之 间 的 DEM 可 通过 一 定 的 算法 实现 相互 转换 。 如 图 12.3 所 示 , 主 
要 形式 有 TIN 至 Grid、TIN 至 Contour、Grid 至 TIN、Grid 至 Contour、Contour 至 
TIN、Contour 至 Grid 等 。 


TIN to GRID 剖 分 内 揪 TIN to Contour (等 值 线 提取 ) 














Grid to TIN 


> Contour to TIN 
(滤波 等 ) (三 角 化 ) 







Grid to Contour (等 值 线 提取 ) 


GRIDDEM [| contourpEM 


Contour to Grid ( 拟 合 内 插 等 ) 
图 12.3 ”DEM 结构 的 相互 转换 
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1. TIN 至 Grid 的 转换 


由 TIN 向 Grid 的 转换 ,实际 上 是 基于 TIN 的 内 插 计算 问题 ,具体 参见 本 书 第 
8 章 空 间 数 据 内 插 。 


2. Grid 至 TIN 的 转换 


”实质 上 ,Grid 至 TIN 的 转换 过 程 是 一 种 特殊 的 散 点 三 角 化 过 程 。 也 可 看 成 是 
DEM 数据 压缩 .DEM 数据 简化 或 基于 DEM 数据 的 综合 过 程 。 本 质 上 , Grid to 
TIN 的 转换 是 非常 简单 的 ,只 要 按 一 定 规则 将 格 网 对 角 线 相连 即 可 形成 相当 精细 
的 TIN。 但 这 样 不 能 体现 出 TIN 的 优势 , 即 用 较 少 的 点 最 大 限度 地 模拟 地 形 表 
面 。 因 此 , 格 网 DEM 向 TIN 的 转换 的 核心 问题 是 从 大 量 的 格 网 点 中 筛选 出 能 够 
表达 地 形 特 征 的 点 集 , 如 山顶 点 .山脊 线 点 .山谷 线 点 、 鞍 部 点 等 ,然后 再 对 这 些 点 
进行 三 角 剖 分 形成 TIN。 上 述 过 程 涉及 两 个 问题 :@ 选 点 原则 , 即 采用 什么 样 的 
标准 选择 格 网 点 ;@ 终止 条 件 , 停 止 格 网 点 判断 的 条 件 。 

目前 实现 格 网 DEM 到 TIN 转换 的 代表 性 算法 有 基于 对 格 网 点 重要 性 进行 标 
识 的 重要 点 法 (Very Important Point, VIP) .保留 特征 点 法 和 基于 最 大 z 容 差 法 
(Maximum z Tolerance ) 的 启发 丢弃 法 、 逐 点 精细 算法 等 。 表 12.2 是 格 网 DEM 转 
换 成 TIN 的 算法 分 类 。 


表 12.2 Grid 至 TIN 的 转换 算法 分 类 






VIP 法 
















格 网 点 重要 程度 保留 特征 点 法 

DEM to TIN 
六 | 启发 丢弃 算法 
逐 点 精细 算法 





1) 基于 格 网 点 重要 性 标识 的 Grid 至 TIN 算法 


基于 格 网 点 重要 性 标识 的 Grid 至 TIN 算法 本 质 上 是 一 种 散 点 的 三 角 剖 分 过 
程 。 它 首先 对 整个 DEM 的 格 网 点 进行 判断 ,选择 具有 特殊 意义 的 地 形 格 网 点 , 然 
后 对 这 些 格 网 再 进行 三 角 痢 分。 根据 对 格 网 点 重要 性 程度 判断 的 方式 ,可 分 为 重 
要 点 法 和 保留 特征 法 两 类 。 

(1) VIP 法 。V 了 HP 法 认为 ,地 面 一 点 的 重要 性 可 通过 该 点 偏离 平均 地 形 表 面 
的 偏离 程度 来 衡量 ,偏离 程度 越 大 ,该 点 就 越 重要 。 该 法 对 格 网 点 重要 人 性 的 评价 是 
在 DEM 局 部 范围 进行 的 ,通常 为 3x3 局 部 窗口 中 , 即 通过 考察 当前 处 理 点 与 周 
围 邻 接点 的 关系 来 评价 该 点 的 重要 程度 。 

如 图 12.4, 设 当前 格 网 点 为 P,P 的 重要 性 可 通过 PP 点 的 实际 高 程 值 与 分 布 
其 周围 的 8 个 格 网 点 所 形成 的 4 个 断面 来 估算 (上 下 左右 .左上 右 下 \ 右上 左下 )。 
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例如 在 GC 剖面 上 ,通过 G、C 可 计算 P 点 在 该 剖面 上 的 高 程 为 





3X3 局 部 窗口 比较 中 心 点 的 高 程 


图 12.4 VIP 评价 中 心 点 的 重要 程度 
i 为 行 导 ;j 为 列 号 ; HE 为 在 GC 剖面 上 的 计算 高 程 ; Hp 为 P 点 的 实际 地 面 高 程 


五 c 一 五 c 





Hp= He+ (12.1) 


HE 与 Hsp 的 差 doc 有 反映 了 P 点 的 GC 剖面 的 偏离 程度 : 
dcec= Hp— Hp (12.2) 
但 由 于 地 形 表 面 的 各 向 异性 ,一 般 在 4 个 剖面 上 下 BF 左右 HD、 左 上 右 下 
AE、 右 上 左下 GC 分 别 计算 出 P 的 4 个 偏差 ,并 取 其 平均 值 为 P 的 重要 性 度量 指 
标 。 即 P 点 的 重要 性 程度 可 通过 下 式 来 计算 : 
4 (12.3) 
要 说 明 的 是 , 式 (12.3) 是 通过 铅 垂 线 方向 上 的 高 差 变 化 来 衡量 偏离 程度 。 据 
相关 的 研究 报道 ,无 论 在 平地 还 是 坡地 ,用 P 到 齐 面 的 垂直 距离 * 比 高 差 要 好 。 
该 算法 使 用 VIP 法 度量 每 一 个 格 网 点 与 真实 地 表 的 偏离 程度 ,然后 通过 重要 
性 指标 可 选择 用 来 构建 TIN 的 数据 点 。 数 据点 选择 既 可 基于 所 要 求 的 点 的 数目 ， 
也 可 基于 指定 的 重要 性 水 平 ( 阔 值 )。 最 后 对 所 选 的 点 进行 三 角 痢 分 即 可 。 
(2) 保留 特征 点 法 。 该 法 首先 在 格 网 DEM 中 找 出 地 形 特征 点 线 ,如 山顶 、 贰 
部 ,谷底 点 、 山 消 线 等 ,然后 在 TIN 中 保留 这 些 点 线 。 这 种 方法 的 关键 是 特征 点 的 
识别 和 特征 线 的 提取 。 


2) 基于 最 大 z 容 差 法 DEM 至 TIN 算法 
最 大 z 容 差 法 也 是 一 种 格 网 点 重要 程度 的 度量 指标 ,但 与 重要 点 法 有 所 不 同 。 
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该 方法 将 重要 点 的 选择 作为 一 个 优化 问题 进行 处 理 , 在 给 定 一 个 格 网 DEM 和 转 
换 后 TIN 中 节点 的 数量 限制 条 件 下 , 寻求 一 个 TIN 与 规则 格 网 DEM 的 最 佳 
拟 合 。 

该 算法 的 基本 思想 是 利用 格 网 点 原始 高 程 和 通过 已 存在 且 包 含 该 点 的 三 角形 
估算 的 高 程 之 差 来 进行 该 点 的 取舍 。 这 是 一 动态 过 程 , 即 首 先 构建 一 个 初始 的 不 
规则 三 角 网 ,然后 对 这 个 不 规则 三 角 网 中 的 每 个 三 角形 计算 格 网 中 每 一 点 与 所 落 
人 三 角形 面 的 高 差 , 并 确定 出 差 值 最 大 的 点 。 如 果 差 值 大 于 指定 的 容许 值 , 便 标记 
该 点 并 将 该 点 添加 到 不 规则 三 角 网 中 。 现 存 不 规则 三 角 网 中 的 每 个 三 角形 都 被 检 
测 后 ,以 选中 添加 的 点 重新 计算 三 角 网 。 整 个 过 程 持续 到 格 网 点 里 所 有 的 三 角形 
都 在 指定 容许 值 范围 即 可 。 

根据 算法 实现 的 不 同 ,分 为 启发 丢弃 算法 和 逐步 精细 算法 两 类 。 两 种 算法 都 
开始 于 一 个 已 存在 的 三 角 网 ,但 启发 丢弃 算法 的 初始 三 角形 为 整个 DEM 的 精细 
三 角 网 ,通过 逐步 判断 而 丢弃 一 些 点 ,形成 较 少 格 网 点 组 成 的 TIN; 而 逐步 精细 算 
法 则 开始 于 一 个 非常 粗糙 的 三 角形 ,通过 不 断 的 添加 格 网 点 而 形成 TIN, 如 
图 12.5 所 示 。 


原始 DEM 启发 丢弃 算法 初始 TIN 逐步 精细 算法 初始 TIN 


图 12.5 启发 丢弃 算法 和 逐步 精细 算法 初始 TIN 


(1) 启发 丢弃 算法 。 启 发 丢弃 算法 是 基于 一 个 已 存在 的 三 角 网 ( 格 网 DEM 可 
通过 对 角 线 连接 转换 成 TIN, 图 12.6)。 该 过 程 是 一 个 重复 循环 过 程 ,每 次 去 掉 一 
个 点 ,直到 没有 点 可 丢弃 为 止 。 

丢弃 点 的 原则 是 已 知 高 程 和 估算 高 程 (通过 格 网 点 所 在 的 三 角形 内 插 得 到 ) 的 
差 值 。 参 见 图 12.6, 启 发 丢弃 算法 的 步骤 如 下 。 

第 一 步 ,对 于 TIN 中 的 每 一 个 结 点 p ,做 如 下 的 工作 :@ 从 TIN 中 暂时 移 去 
PP;@ 对 移 去 p 点 后 所 形成 的 多 边 形 进行 三 角 化 ;@ 判断 p 点 所 在 的 三 角形 ,并 
在 该 三 角形 中 内 插 计算 p 点 的 高 程 ;@ 计算 p 点 的 内 插 高 程 和 实际 高 程 的 差 值 
e(p) 并 存储 ;@ p 点 放 回 原来 的 TIN 中 。 

第 二 步 ,考察 所 存储 的 每 一 结 点 的 差 值 e(p), 如 果 具 有 最 小 的 差 值 e(p) 的 格 
网 点 ( 设 为 ") 大 于 给 定 的 阔 值 ( 视 为 比较 重要 的 点 ), 则 算法 结束 并 输出 TIN, 反 之 
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图 12.6 启发 丢弃 算法 


进行 下 一 步 。 

第 三 步 ,从 TIN 中 提取 与 g 相 邻 的 结 点 , 设 为 wi ,wy，,…, wm, 并 从 TIN 中 删 
除 gq 点 ;对 删除 g 点 后 所 形成 的 多 边 形 ,ws，… ,ww ,zl 进行 三 角 剖 分 。 

第 四 步 , 按 照 第 一 步 中 的 方法 重新 计算 多 边 形 tl, rz，… wm, w1 中 每 一 个 
顶点 的 误差 值 e(w;), 返 回 第 二 步 。 

(2) 逐步 精细 算法 。 逐 步 精 细 算 法 是 一 个 逐步 精 化 过 程 。 它 与 启发 丢弃 算法 
的 过 程 刚 好 相反 ,是 从 一 个 初始 三 角 网 开始 ,不 断 地 向 其 中 加 入 新 点 。 当 加 入 新 点 
后 的 TIN 与 原始 格 网 的 误差 在 允许 范围 内 ,过 程 停止 。 

该 算法 是 在 整体 上 获得 与 原始 Grid 最 接近 的 TIN, 过 程 与 逐 点 插入 法 比较 类 
似 , 但 要 判断 何 时 终止 循环 。 参见 图 12.7, 逐 步 精细 算法 过 程 如 下 : 


---@---- 
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图 12.7 逐步 精细 算法 


第 一 步 , 形 成 初始 三 角 网 TIN( 图 12.7); 

第 二 步 ,判断 DEM 中 每 个 格 网 点 的 所 在 的 三 角形 ,并 计算 在 该 三 角形 中 的 内 
插 高 程 值 和 实际 高 程 之 差 ( 称 为 误差 ); 

第 三 步 ,如 果 所 有 网 点 的 误差 值 都 在 最 大 的 容许 范围 之 内 , 则 程序 结束 ,输出 
TIN, 反 之 进行 下 一 步 ; 

第 四 步 , 将 具有 最 大 误差 的 格 网 点 插入 已 存在 的 TIN 中 ,返回 第 二 步 。 
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3. Grid 至 等 高 线 的 转换 


1) 等 值 点 内 插 及 其 定位 


设 规则 格 网 DEM 是 由 mx Xn 个 网 格 数据 点 组 成 , 沿 和 方向 单位 网 格 边 长 为 
CNi, 沿 Y 方向 单位 网 格 边 长 为 CN;, 沿 立方 向 的 分 割 记 为 j=1,2,…,n; 沿 了 方 
向 的 分 割 记 为 ;= 1,2,…,m ,于 是 可 用 BB; 表 示 任 一 网 格 点 的 数据 。 由 上 可 计算 
得 任意 网 格 点 的 坐标 : 

Ti,;=J °CNI 
= i"CN, 

对 于 m Xn 个 网 格 点 组 成 的 DEM 区 域 , 纵 边 数 为 (m 一 1)n, 横 边 数 为 (n 一 
1)*m。 对 于 位 于 任 一 边 上 的 等 值 点 位 置 ,可 表示 为 

HH;,;(i=1,2,…,m 一 1;j =1,2,…,n) 表 示 位 于 纵 边 上 的 等 值 点 ; 

SS;,j;(i1=1,2,…,m;j 二 1,2,….n 一 1) 表 示 位 于 横 边 上 的 等 值 点 。 

为 了 计算 等 值 点 在 网 格 边 上 的 位 置 ,首先 要 确定 等 值 线 与 网 格 边 相交 的 条 件 。 
设 等 值 线 高 程 值 为 W, 显 然 , 边 上 存在 等 值 点 的 条 件 是 W 值 处 于 相 邻 网 格 点 数值 
之 间 。 因 此 ,可 以 用 下 式 来 判断 格 网 边 上 是 否 存在 等 高 线 点 ; 

当 (BB; — W)*(BB,;,j+1— W)<0 时 , 横 边 上 存在 等 值 点 ; 

当 (BB; ;- 琅 )(BBi 一 克 )<0 时 , 纵 边 上 存在 等 值 点 。 

如 果 上 式 成 立 , 即 可 采用 线性 内 插 方法 计算 出 等 值 点 位 置 。 设 有 一 ABDC 网 
格 ( 图 12.8 ), 其 高 程 值 依次 为 BB;,;、 
BB;,j+1、BB;41.; 和 BBi41,;+1, A 为 横 边 
AB 边 的 内 插 等 值 点 , SS; ;为 A' 离 A 点 的 
距离 , 则 

W-BB;,;, SS;, 
BB;;+1- BB;;, CN 
令 CNi=1 得 











SS WwW- BB.,,; 
摊 ~ BB;i,j+1 9 BB;,; 
图 12.8 ”等 值 点 内 插 及 其 定位 在 此 ,SS;,; 表 示 A’ 到 A 点 的 距离 与 


横 边 长 的 相对 比值 ,0 专 SS;,; 志 1。 
同 理 ,B 是 AC 边 的 内 插 等 值 点 , HH;,; 是 B 到 A 的 距离 , 令 CN,=1, 则 可 得 
HH ;=(W- BB,,;)/(BB;+1,; - BB;,;) ,同样 0O<HH;,,<1。 
这 样 就 可 以 使 用 上 式 对 任 一 数值 等 值 线 的 各 等 值 点 位 置 进行 计算 ,并 分 别 存 
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储 于 SS(i,j) 和 HH(i,j) 两 个 数组 。 只 有 当 这 两 个 数组 的 数值 大 于 0 和 小 于 1 
时 , 才 有 等 值 点 通过 ,因此 也 可 以 利用 SS(i,j) 和 HH(i,j) 值 来 作为 判断 有 无 等 
值 点 通过 的 条 件 。 即 当 其 小 于 或 等 于 0、 大 于 或 等 于 1 时 , 则 表示 该 边 无 等 值 点 通 
过 ,或 等 值 点 就 是 本 身 网 格 点 。 为 了 区 别 , 可 采用 SS;,; = -2 和 HH;,; = -2 来 表 
示 网 格 边 无 等 值 点 。 


2) 等 值 点 追踪 


在 给 定 的 等 高 线 W 的 所 有 等 值 点 位 置 内 插 完 后 ,应 该 想到 这 些 等 值 点 可 能 
组 成 若干 条 等 值 线 ,而 且 可 能 是 开 曲 线 或 闭合 曲线 。 为 了 逐条 绘制 等 值 线 ,必须 找 
到 每 条 等 值 线 的 线头 并 顺序 追踪 到 线 尾 。 即 把 一 条 等 值 线 的 全 部 等 值 点 按 顺 序 排 
列 好 ,这 是 保证 等 值 线 合理 连接 和 不 相交 的 重要 条 件 , 先 讨论 追踪 问题 。 

(1) 为 了 确定 追踪 方案 ,要 研究 某 一 等 值 线 在 矩形 网 格 内 走向 的 几 种 可 能 ， 
并 通过 确定 等 值 线 走 向 与 等 值 点 坐标 之 间 的 关系 来 建立 跟踪 条 件 。 由 于 等 值 点 
位 于 网 格 边 上 ,所 以 等 值 线 通 过 相 邻 网 格 的 走向 只 有 四 种 可 能 : 自 下 而 上 , 自 左 
向 右 , 自 上 而 下 , 自 右 向 左 。 因 此 ,如 果 找 到 某 一 等 值 线头 位 于 某 一 网 格 边 上 ,该 
网 格 边 往往 是 相 邻 网 格 的 公共 边 ,既是 前 一 网 格 的 出 口 边 又 是 后 一 网 格 的 进入 
边 , 则 进入 边 的 方向 对 于 每 一 个 网 格 都 有 上 、 下 , 左 、 右 四 种 情形 , 即 追 踪 等 值 点 
有 四 种 可 能 。Q@ 自 下 而 上 追踪 :由 图 12.9(a) 可 以 看 到 ,在 方 格 I 上 有 等 值 点 
ai; 它 的 位 置 有 三 种 状况 , 即 HH(i,j;)、SS(i,j) 和 HH(i,j+1), 卫 号 方 格 上 
az 等 值 点 为 SS(i+1,7)。 显 然 ,我 们 比较 a1 和 as 的 坐标 位 置 , 可 以 得 出 ai 点 
取 整 的 纵 坐 标 一 定 小 于 az 点 取 整 的 纵 坐 标 。 因 此 ,只 要 满足 i。 < i, 的 条 件 , 即 
可 自 下 而 上 地 追踪 。 如 果 有 as 点 , 它 一 定 是 位 于 方 格 开 的 另外 三 边 上 。@ 自 左 
向 右 追 踪 : 图 12.9(b) 表 示 位 于 工 号 方 格 内 的 等 值 点 ai 同样 有 三 种 可 能 位 置 : 
HH(i,j)、SS(i,j) 和 SS(i+1,j),az 点 位 于 开 号 方 格 , 进 人 边 记 为 HH(i,j+ 
1)。 这 时 比较 ci: 和 az 的 坐标 ,只 要 满足 j。 < jo 的 条 件 , 即 可 自 左 向 右 追 踪 。 
此 时 ,as 点 一 定位 于 开 号 方 格 的 另外 三 边 上 。@@ 自 上 而 下 追踪 :图 12.9(c) 中 位 
于 工 号 方 格 内 的 ai 点 有 三 种 可 能 位 置 :; HH(i,j;)、HH(i,j+1) 和 SS(i+1， 
J)。 位 于 开 号 方 格 进 入 边 的 az 点 为 SS(i,j)。 这 时 比较 ai 和 az 点 的 位 置 , 就 
不 能 建立 追踪 条 件 ,由 于 考虑 了 排除 自 下 而 上 和 自 左 至 右 走向 的 可 能 ,因而 可 以 
用 az 点 取 整 模 坐 标 小 于 az 点 的 绝对 值 , 即 TINT(zo。)< zo 或 者 jo,* CNI< za 
的 条 件 来 判断 。 满 足 上 述 条 件 时 , 自 上 而 下 的 追踪 a3 点 ,如 有 as 点 ,定位 于 本 
号 方 格 的 东西 . 南 三 边 上 。@ 自 右 向 左 追踪 : 当 不 满足 上 述 三 种 条 件 时 , 即 可 确 
定 是 自 右 向 左 追 踪 。 实 际 上 可 用 关系 式 i。* CN < yw, 来 判断 向 左 追 踪 的 条 件 ， 
如 图 12.9(d) 所 示 。 
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(b) 


itlj a itl,jtl 





(qd) 


图 12.9 追踪 等 值 点 的 四 种 情况 示意 图 


表 12.3 对 上 述 四 种 情况 进行 了 总 结 。 
表 12.3 四 类 追踪 情况 判断 方法 





追踪 方向 自 下 而 上 自 左 而 右 自 上 而 下 自 右 而 左 
判断 条 件 ial < ia, jal < jo, ja CNI< Ta, ia CN2< ya, 
追踪 判断 顺序 多 





综 上 所 述 ,追踪 等 值 点 是 在 任意 两 个 相 邻 网 格 内 进行 的 ,首先 是 在 已 知 ai 和 
22 点 的 位 置 时 ,并 且 az 点 位 于 工 和 开 号 方 格 的 公共 边 上 ,al 是 位 于 工 号 方 格 的 
其 他 三 边 上 。 而 且 我 们 用 方 格 的 左下 角 标 (;,7) 表 示 工 号 方 格 的 序号 , 则 (+ 1， 
j)、(i,j+1)、(i 一 1,j)、(i,j 一 1) 为 了 号 方 格 的 四 种 情况 的 序号 。 显 然 , i,j; 是 始 
终 处 于 动态 变化 中 。 

(2) 已 知 as 点 是 位 于 下 号 方 格 的 其 余 三 边 上 ,那么 最 终 如 何 确定 是 其 中 的 哪 
一 边 呢 ?这 是 一 个 十 分 重要 的 问题 。 类 似 于 手工 勾 绘 等 值 线 产生 多 义 的 情况 , 必 
须 合 理 地 选择 位 于 其 余 三 边 上 的 一 个 等 值 点 。 不 然 ,将 会 出 现 同 一 等 值 线 的 交叉 
和 分 支 走 向 不 确定 的 多 义 性 。 例 如 , 某 一 网 格 上 的 四 点 连接 的 状况 可 能 有 三 种 
(图 12.10),a、6 即 为 多 义 ,c 是 不 允许 的 ,必须 排除 。 对 于 等 值 线 连接 的 多 义 性 ， 
情况 是 比较 复杂 的 。 如 图 12.11 所 示 , 对 于 相同 等 值 点 可 以 有 多 种 方式 连接 。 这 
些 问题 不 仅 在 自动 勾 绘 等 值 线 时 会 经 常 出 现 ,手工 勾 绘 等 值 线 时 ,也 会 遇 到 。 这 种 
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情况 的 处 理 往往 根据 制图 人 员 的 实践 经 验 作出 , 即 参考 周围 等 值 线 的 走向 和 趋势 ， 
为 强调 等 值 线 之 间 协 调 一 致 ,突出 表现 区 域 特征 而 作出 各 种 选择 。 但 是 ,自动 勾 绘 
等 值 线 时 必须 对 上 述 情 况 预先 作出 判断 ,这 只 能 根据 一 般 的 规律 比较 合理 地 解决 。 
通常 ,首先 是 考虑 等 值 线 原来 前 进 的 方向 , 即 顺 着 原来 等 值 线 走向 延伸 下 去 ,其 次 
是 根据 距离 远近 来 选择 cs 点 ,下 面 给 出 一 种 具体 判别 方法 。 


(a) (b) (c) 


图 12.10 等 值 点 连接 的 几 种 可 能 情形 





| : : ! |i ! ! 
: | | | : 
本 





图 12.11 等 值 点 连接 的 几 种 可 能 情形 


设 我 们 已 知 某 一 等 值 线 的 起 点 al 和 a 点 ,现在 要 追踪 as 点 ,可 以 作 如 下 的 选 
择 。) is, < 加 时 , 即 自 下 而 上 追踪 等 值 点 ,as 只 能 在 HH(is,j2)、HH(i,,j2+1) 和 
SS(iz+1,7) 三 边 寻 找 。 在 此 情况 下 ,选择 cs 点 的 顺序 为 : 当 HH(is,j,) 和 HH(i,， 
疡 +1) 都 有 等 值 点 时 , 则 选取 其 中 较 小 的 ( 即 距 离 近 的 ) 为 cs 点 ; 当 HH(i2,j2) 和 HH 
(iz,j2 + 1) 只 有 一 个 等 值 点 时 ,该 点 即 为 a3 点 ; 当 纵 边 上 没有 等 值 点 时 ， 
则 SS(iz+1,j2) 中 必 有 等 值 点 a3。@ j。<j, 时 , 即 自 左 向 右 追 踪 等 值 点 ,a 点 只 
能 在 SS(io,j2)、SS(i2+1,72) 和 HH(is,j2+1) 三 边 中 找 。 在 该 种 情况 下 ,选取 
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a3 点 的 顺序 是 :在 SS(is,j2) 和 SS(is+1,j2) 两 横 边 上 都 有 等 值 点 时 , 则 取 其 中 
距离 较 小 的 点 为 a3; 在 SS(is,j2) 和 SS(i+1,72) 两 横 边 只 有 一 个 等 值 点 时 ,该 
点 选 为 a3; 若 在 两 横 边 没有 等 值 点 , 则 as 点 必 位 于 HH(is,j2+1) 纵 边 上 。@ Jo 
CN1< zs, 时 , 即 自 上 而 下 追踪 等 值 点 时 ,a3 点 在 HH(is 1,j2)、HH(is -1,j2+ 
1) 和 SS(is 一 1,j2) 中 找 。 在 此 种 情况 下 选取 as 的 顺序 是 :车 HH(is 一 1,j2) 和 和 
HH(is 一 1,j2+1) 纵 边 上 都 有 等 值 点 , 则 取 其 较 大 一 点 为 a3; 在 HH(is 一 1,j2) 中 
只 有 一 边 有 等 值 点 ,该 点 即 为 点 a3; 若 HH(is 一 1,j2) 和 HH(is 一 1,72+1) 中 均 没 
有 等 值 点 , 则 a3 点 必 在 SS(i-1,j2) 边 上 。 四 着 以 上 三 种 情况 均 不 成 立 , 即 从 右 
至 左 追 踪 等 值 线 时 ,as 等 值 点 在 SS(is+1,72 一 1)、SS(iz,j2 一 1) 和 HH(iz,j2 一 
1) 中 找 ,此 时 as 点 选取 的 顺序 是 :车 SS(z+1l,7j2 -1) 和 SS(z2,j2-1) 横 边 上 都 
有 等 值 点 , 则 选取 较 大 距离 的 点 为 a3, 若 SS(i,+1,j2 一 1) 和 SS(i,,j2 一 1) 横 边 
上 只 有 一 边 有 等 值 点 , 则 该 点 为 a3; 若 SS(is+1,js 一 1) 和 SS(is,js 一 1) 边 上 都 
没有 等 值 点 , 则 as 必 位 于 HEHE(i2,72-1) 边 上 。 

(3) 起 始终 止 等 值 点 的 寻找 和 分 支 识别 :上 面 已 经 说 明 , 追 踪 某 一 等 值 线 的 
首要 条 件 是 要 找到 该 等 值 线 的 起 始点 。 开 等 值 线 和 闭合 等 值 线 在 寻找 线头 时 有 不 
同 的 地 方 。 从 制图 区 域 网 格 边界 开始 又 结束 于 网 格 边界 的 等 值 线 称 开 等 值 线 ,位 
于 制图 区 域 网 格 边 内 部 开始 于 任 一 点 又 结束 于 该 点 的 等 值 线 称 闭合 等 值 线 。 所 
以 , 开 等 值 线 的 线头 要 从 制图 区 域 的 4 个 边界 上 去 找 ,闭合 等 值 线 的 线头 只 能 从 制 
图 区 域 的 内 部 网 格 上 去 找 。 其 算法 介绍 如 下 :@ 在 底 边 (; =1) 上 找 起 始点 。 只 要 
SS(1,7)(j=1,2,…,n 一 1) 有 等 值 点 , 即 令 它 为 a 点 ,然后 虚设 ai 点 ,证 点 za = 
0, 采 用 i。< i 的 条 件 去 追踪 as 点 。®@ 在 西边 (j =1) 上 找 起 始点 。 只 要 HH(i， 
1)(i=1,2,…,m 一 1) 有 等 值 点 , 即 令 它 为 az 点 ,然后 虚设 al 点 ,让 点 jo =0, 采 
用 js。,<j, 的 条 件 去 追踪 as 点 。@ 在 上 边 (i= m ) 找 起 始点 。 只 要 SS(m ,7 ) (7 
=1,2,…,n 一 1) 有 等 值 点 , 即 令 它 为 az 点 ,然后 虚设 el 点 ,让 点 z = m+1, 采 用 
ia" CN1< zu, 的 条 件 去 追踪 as 点 。@ 在 东边 (j =) 找 起 始点 。 只 要 HH(i,n) 
(i=1,2,…,m 1) 有 等 值 点 , 即 令 它 为 a2 点 ,然后 虚设 a1 点 ,让 点 j。,=n+1, 采 
用 js,*CN2< ,的 条 件 去 追逐 a3 点 。 

这 样 找到 每 条 等 值 线 的 起 、 始 两 等 值 点 ez .as 后 ,我 们 就 可 按照 上 述 四 种 条 
件 顺 序 寻 找 各 等 值 点 ,每 追踪 一 点 就 记录 该 点 ,并 且 每 次 均 需 要 改变 或 上 推 各 等 值 
点 的 顺序 标号 和 相应 的 下 标 变量 。 即 43 这 42, 92 这 a1,jo, 这 jo , 疡 二 入 ,ia, 之 i。 
继续 追踪 一 直到 cs 点 位 于 边界 上 为 止 , 即 满足 z = CNi、y。,= CNz jo = ni 
=m 之 中 任 一 条 件 时 ,再 停止 追踪 。 

对 于 闭合 等 值 线 必须 在 制图 区 域内 的 网 格 边 上 去 寻找 等 值 线 的 起 始点 ,而 且 
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只 要 是 矩形 内 部 网 格 任意 边 上 的 等 值 点 均 可 作为 起 始点 。 可 以 采用 这 样 的 方案 ， 
即 在 各 条 纵 边 上 顺 次 找 出 初始 等 值 点 , 即 从 j=1 到 -1 和 从 i=1 到 m 一 1 各 条 
横 边 上 逐次 找 出 等 值 点 。 当 0< HH(Gi,j)<1[i=1,2,3,…,m 一 1;j=1,2,3,*…， 
n 一 1] 时 即 有 等 值 点 存在 ,并 令 该 点 为 cz, 然后 虚设 ai 点 ,并 js。 =0, 即 可 采用 j。 
<jo, 的 条 件 ,从 西向 东 追 踪 as 等 值 点 ,这 样 得 到 起 始 a2、as 点 ,经 过 上 推 和 改变 
下 标 变量 , 即 可 采用 上 述 四 种 追踪 条 件 ,一 直 追 踪 到 起 始点 本 身 为 止 。 关 于 追踪 等 
值 点 的 起 始 方向 和 顺序 ,如 图 12.12 所 示 。 
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图 12.12 追踪 等 值 点 的 起 始 方向 和 顺序 图 12.13 相同 值 等 值 线 的 不 同 分 支 


由 于 任 一 数值 的 等 值 线 可 能 有 多 个 分 支 (图 12.13), 因 此 ,我 们 追踪 任 一 分 支 
等 值 线 时 都 必须 记录 并 加 以 区 别 。 在 程序 中 可 以 这 样 安排 :每 当 追 踪 一 个 等 值 点 
时 ,要 随时 从 HH(i,j) 和 SS(i,j) 场 中 抹 去 ,以 免 下 次 重复 使 用 。 追 踪 的 该 等 值 
点 需 计算 绝对 坐标 ,存放 于 专门 绘图 用 的 数据 场 内 。 这 样 ,一 条 开 等 值 线 分 支 追 踪 
完毕 ,马上 使 用 专门 记录 追踪 等 值 点 的 数据 场 存 放 的 等 值 点 x,y 坐标 值 , 绘 出 该 
条 等 值 线 。 绘 完 开 等 值 线 后 ,再 追踪 闭合 等 值 线 ,只 有 当 .HH(i,j) 和 SS(i,j) 全 
部 数值 为 -2 时 , 才 标 志 着 W 值 等 值 线 全 部 分 支 绘 完 。 然 后 就 可 以 内 插 新 的 W 
值 等 值 点 ,反复 上 述 过 程 ,直到 全 部 等 值 线 绘 完 。 

(4) 等 值 点 绝对 坐标 值 计算 和 特殊 条 件 的 处 理 : 为 了 最 后 绘制 光滑 等 值 线 , 必 
须 将 内 插 得 到 的 等 值 点 相对 位 置 转换 为 同一 坐标 原点 的 绝对 坐标 。 为 此 设 参数 S 
=1, 表 示 等 值 点 位 于 横 边 上 ,S=0 时 ,表示 等 值 点 位 于 纵 边 上 , 则 a1、as、a3 等 值 
点 的 绝对 坐标 计算 公式 为 
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za = [j1+ S$*SS(i1,71)]* CN 
ya, = [ii+(1- S):HH(i,1)]:CN; 


xa, = [j2+ S$°SS(i2,j2)]: CN 


;4 


Ya [iz+ (1- S$):HH(i,j2) |: CN， 


2 


Xa,— [j3+ S'SS(i3,73) 1]: CNi 


3 


ya, = [i3+(1- S$):HH(i3,j3)]:CN, 


使 用 上 述 公式 ,在 每 追踪 出 新 的 等 值 点 时 , 即 要 随时 计算 该 点 的 绝对 坐标 值 ， 

按 顺序 存储 于 专门 数据 场 内 并 记 数 ,以 便 为 下 一 步 绘制 光滑 曲线 使 用 。 
我 们 在 内 播 等 值 点 时 , 当 遇 到 网 格 高 程 值 和 等 值 线 相等 
的 情况 ,此 时 等 高 线 必然 通过 网 格 点 。 而 该 网 格 点 同时 又 是 
4 个 相 邻 网 格 的 公共 交点 (图 12.14 )。 这 样 ,在 4 个 相 邻 横 
边 和 纵 边 上 得 到 不 是 0 就 是 1 的 4 个 值 [ 即 SS(i,;)=0， 
HH(i,;)=0,SS(i,; -1)=1 BBC-1,7)=0], 而 同一 
等 值 点 分 别 存放 于 4 个 存储 单元 中 ,所 以 在 追踪 等 值 点 时 ， 
图 12.14 ”等 值 线 通 过 一 定 会 发 生 重复 使 用 和 追踪 混乱 的 问题 。 对 此 情况 ,必须 预 
网 格 交点 的 情况 。 先 处 理 。 其 方法 是 对 该 网 格 点 加 上 一 个 足够 小 的 数值 予以 
纠正 ,应 该 选择 这 样 的 小 数 , 使 其 不 致 影响 绘图 精度 ,而 又 避 

免 直 接 利 用 网 格 点 。 


4. TIN 至 等 高 线 的 转换 


< 











1) 等 值 点 内 插 方 法 及 其 平面 位 置 确定 


建立 三 角 网 信息 后 ,为 了 绘 出 等 值 线 , 还 必须 找 出 位 于 各 原始 数据 点 间 等 值 点 
的 平面 位 置 。 显 然 ,等 值 点 的 内 插 都 是 在 三 角形 的 边 上 进行 的 ,因此 先 分 析 任 一 三 
角形 的 各 边 上 是 否 有 等 值 点 的 几 种 情形 。 

(1) 若 三 角形 的 三 个 顶点 的 高 程 相等 , 则 三 角形 的 边 上 无 等 值 点 。 如 果 三 顶 
点 的 高 程 等 于 等 值 线 的 高 程 , 即 z = z1 = z= z3, 则 三 顶点 就 是 等 值 点 ,由 于 顶点 
可 能 被 两 个 以 上 三 角形 共用 ,所 以 在 本 三 角形 中 将 不 考虑 这 种 情况 ,如 图 12.15 
(a) 所 示 。 

(2) 若 三 角形 三 顶点 高 程 值 不 相等 ,那么 , 当 每 条 边 二 端点 高 程 满足 : 

(zz 一 z1)"(z 一 z2) 之 0 时 , 则 该 边 无 等 值 点 ,否则 必 有 等 值 点 ; 

(zz 一 1)*(z 一 z3) 之 0 时 , 则 该 边 无 等 值 点 ,否则 必 有 等 值 点 ; 

(z 一 z2)'(z 一 z3) 之 0 时 , 则 该 边 无 等 值 点 ,否则 必 有 等 值 点 ; 
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但 是 ,一 个 三 角形 不 可 能 三 条 边 上 都 有 等 值 点 ,只 可 能 在 两 条 边 上 有 等 值 点 ， 
即 只 要 在 一 条 边 上 有 等 值 点 ,在 其 余 两 边 上 必 有 一 边 存 在 等 值 点 。 这 是 最 常见 的 
现象 ,如 图 12.15(b) 所 示 。 

(3) 若 三 角形 三 顶点 高 程 不 等 ,而 其 中 有 一 个 顶点 高 程 等 于 等 值 线 高 程 , 则 如 
果 该 三 角形 还 存在 一 个 等 值 点 ,必须 是 位 于 该 顶点 的 对 边 上 ,如 图 12.15(c) 所 示 。 
凡是 一 个 三 角形 只 有 两 个 等 值 点 的 情况 ,都 必须 加 以 考虑 。 

(4) 若 三 角形 有 两 个 顶点 高 程 相等 ,该 三 角形 如 果 存 在 等 值 点 , 必 位 于 靠近 第 
三 点 的 两 边 上 ,如 图 12.15(d) 或 者 该 相等 的 两 顶点 就 是 等 值 点 [图 12.15(e)]。 后 
一 种 情况 将 不 在 本 三 角形 中 考虑 。 
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图 12.15 三 角形 内 揪 等 值 点 的 各 种 情形 


在 确定 三 角形 边 上 存在 等 值 点 后 ,用 内 择 法 求 得 等 值 点 的 坐标 ,其 线性 插值 公 
式 参考 图 12.16 可 写 为 
TB Xl + 二 (> 一 21) 
Z2 ”之 1 
yy2 
之 2 一 





Jy1 
YB = Y1+ (z— z1) 
21 


3 一 之 2 
By (z— z2) 
3 2 
Jy3 2 
So i 





式 中 :zi、y1、zi、T2、y2、Z2、XT3、y3、z3 分 别 为 三 角形 三 顶点 坐标 ; z 为 等 高 线 值 , 显 
然 等 值 点 坐标 应 为 制图 地 区 采用 的 同一 原点 的 坐标 值 。 


2) 起 始 等 值 点 定位 


具有 z 值 的 等 值 点 往往 组 成 一 条 以 上 的 等 值 线 。 它 们 可 能 是 开 曲 线 , 也 可 能 
是 闭合 等 高 线 ,无 论 绘制 哪 种 等 值 线 ,都 必须 首先 找 出 起 始 等 值 点 ,该 点 被 称 为 线 
头 。 闭 合 等 值 线 一 定位 于 制图 区 域内 部 ,其 内 部 三 角形 边 上 任 一 等 值 点 均 可 作为 
线头 和 线 尾 。 开 曲 等 值 线 一 定 开 始 于 制图 区 域 的 边界 又 结束 于 边界 ,所 以 起 始 等 
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值 点 和 终止 等 值 点 一 定位 于 边界 三 角形 的 最 外 边 上 。 找 出 边界 上 等 值 点 的 方法 可 
参考 图 12.17, 该 图 有 9 个 三 角形 和 7 个 等 值 点 ,其 中 a、g 两 个 等 值 点 是 等 值 线 的 
线头 和 线 尾 。 显 然 a、g 两 点 具有 的 数学 特征 可 以 这 样 判 别 : 在 任 一 三 角形 中 如 存 
在 两 个 等 值 点 ,其 中 一 点 必然 是 等 值 线 通过 该 三 角形 的 人 口 点 , 另 一 个 是 等 值 线 走 
出 该 三 角形 的 出 口 点 。 但 是 ,如 果 等 值 点 不 是 位 于 边界 之 上 (如 图 12.17 中 8、c、 
de 点), 则 该 点 既是 前 一 个 三 角形 的 出 口 点 ,又 是 下 一 个 相 邻 三 角形 的 人 口 
点 。 而 如 果 该 点 是 位 于 边界 上 的 等 值 点 , 它 只 能 是 该 三 角形 的 人 口 点 或 者 是 出 口 
点 ,不 可 能 同时 是 人 口 点 又 是 出 口 点 。 






0 
Crary- ee | 


oo > 
(x2y2) 


图 12.16 TIN 内 插 等 值 点 示意 图 图 12.17 寻找 开 等 值 线 的 起 始点 和 终止 点 


为 了 找 出 位 于 边界 上 的 等 值 点 ,首先 按 三 角形 的 序号 找 出 有 等 值 点 的 三 角 
形 ,例如 工 号 三 角形 , 它 的 人 口 等 值 点 坐标 记 为 Xp(1, 工 ) .Ya(1, 工 ) ,使 用 该 等 
值 点 坐标 同 全 部 三 角形 人 口 等 值 点 坐标 Xp(1, 1)、Yp(1, 了) 以 及 出 口 等 值 点 坐 
标 Xp(2,1)、Ys(2,1)(I=1,2,…,K,K 为 三 角形 号 数 ) 作 比较 ,其 比较 结果 在 
L= 了 的 条 件 下 ,必然 产生 3(1, 工 )= Xp(1,1), Yp(1, 工 ) = Ysp(1, 了 1), 即 为 一 
个 三 角形 的 同一 等 值 点 ,此 时 M 记 数 器 置 1。 作 全 等 比较 又 可 能 是 在 上 L 关 1 的 
情况 下 , Xp(1,L)= Xp(2,1), Yes(1 工 )=Ys(2,T), 即 在 三 角形 序号 不 等 的 情 
况 下 工 号 三 角形 进 点 等 于 相 邻 三 角形 的 出 点 ,此 时 计数 器 M= M +1。 所 以 ， 
根据 上 述 起 始 和 终止 等 值 点 的 数学 特征 可 以 判断 : 当 M=1 时 ,该 等 值 点 位 于 边 
界 上 , 即 为 线头 ; 当 M=2 时 ,等 值 点 不 在 边界 上 , 故 不 可 能 是 线头 。 同 理 , 再 使 
用 工 号 三 角形 出 口 等 值 点 坐标 Xes(2, 工 ) 和 Yps(2, 志 ) 作 上 述 比 较 , 则 获得 完全 
相同 的 结果 。 在 程序 设计 中 使 用 Ls(L ) 场 存放 M 值 , 当 Lp(L)=1 时 , 即 为 要 
寻找 的 等 值 线 线头 。 
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3) 等 值 点 追踪 


线头 找到 后 ,就 要 顺序 地 追踪 出 一 条 等 值 线 的 全 部 等 值 点 ,并 计算 出 总 共有 多 少 
个 等 值 点 。 由 内 插 得 到 的 等 值 点 是 按 三 角形 的 序号 排列 的 ,是 不 规则 的 ,为 了 按 一 条 
等 值 线 通过 的 先后 顺序 排列 ,必须 顺 着 线头 按照 一 定 算法 进行 追踪 。 显 然 , 按 顺 序 排 
列 的 等 值 点 只 存在 于 相 邻 的 三 角形 中 。 所 以 ,可 利用 一 等 值 点 既是 某 个 三 角形 的 出 
口 点 ,又 是 相 邻 三 角形 的 人 口 点 的 原理 ,建立 追踪 的 算法 。 具 体 方法 如 下 : 

(1) 首先 从 Lp( 工 ) 场 找到 数值 为 1 的 三 角形 号 , 即 找到 开 曲 等 值 线 的 线头 。 
并 将 该 等 值 点 (进入 点 )x、y 坐标 记录 在 专门 数据 场 中 , 即 Xp (Lp )= Xp(1, 工 )、 
Yp (Lp )= Ysp(1,L) ;Lp 为 等 值 点 记 数 。 

(2) 按 三 角形 顺序 使 用 该 等 值 点 坐标 同 全 部 三 角形 的 所 有 等 值 点 进行 全 等 比 
较 ,在 找到 该 点 后 即 满足 Xp (1) = Xp(1,1)、Yp,(1) = Ys(1, 了) 的 条 件 下 ,立即 记 
录 该 三 角形 另 一 等 值 点 ,并 使 等 值 点 记 数 器 加 1, 即 从 Lp = Lp +1, Xp (2)= 
Xp(2,1), Yp (2) = YB(2, 了 1)。 之 后 要 抹 去 该 三 角形 的 等 值 点 ,以 免 以 后 重复 使 
用 , 即 La( 工 )=0。 随 后 用 被 记录 的 该 等 值 点 同 全 部 三 角形 所 有 等 值 点 比较 ,在 某 
一 三 角形 等 值 点 同 该 记录 等 值 点 相等 的 情况 下 , 即 满足 Xp (Lp ) = Xe(1,D)、 
Yp,(Lp,) = Ye(1,T), 然 后 再 抹 去 该 点 。 下 面 再 用 被 记录 的 等 值 点 和 其 余 未 被 追 


踪 的 等 值 点 作 全 等 比较 ,重复 以 上 过 程 ,一直 追 踪 到 边界 等 值 点 为 止 。 

(3) 当 某 一 数值 等 值 线 全 部 追踪 后 , 即 调用 曲线 光滑 子 程序 ,把 离散 等 值 点 连 
接 成 光滑 曲线 。 这 里 要 注意 的 是 对 于 某 一 数据 值 等 值 线 可 能 有 多 条 分 支 。 此 时 ， 
应 同样 先 绘 出 所 有 开 曲 等 值 线 、 在 不 出 现 记录 开 曲 等 值 线 线头 的 La( 工 ) 场 为 工 的 
情况 下 , 转 和 人 绘 闭 合 等 值 线 。 闭 合 等 值 线 的 线头 可 以 从 任 一 三 角形 等 值 点 开始 ,并 
按 上 述 方法 追踪 和 光滑 连接 。 绘 完 某 一 数值 等 值 线 后 ,再 开始 下 一 个 数值 等 值 线 
的 绘制 ,直到 完成 全 部 等 值 线 的 绘制 为 止 。 


12.2 基本 地 形 因 子 分 析 算 法 
12.2.1 披 面 因子 提取 的 算法 基础 


1. DEM 格 网 数据 的 空间 矢量 表达 


在 DEM 中 ,具有 空间 矢量 特征 的 坡 面 地 形 因子 的 自动 提取 ,通常 采用 基于 空 
间 矢 量 分 析 原 理 的 差分 计算 方法 完成 。 因 此 ,建立 DEM 模型 每 一 格 网 的 标准 矢 
量 P;,;( 图 12.18) ,是 理解 .掌握 坡 面 地 形 因子 科学 涵义 的 基础 。 
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x(N) 





图 12.18 DEM 格 网 数据 的 空间 矢量 模型 


对 于 每 个 由 相 邻 8 个 格 网 点 确定 的 地 表 微 分 单元 , 令 矢量 p;,; = {xxi,j, yi,j， 
zi,j| 的 基本 矢量 为 p,、p,(p; 与 XOz 平面 平行 , p, 与 yOz 平面 平行 )。p,、p, 计算 
公式 如 下 

pz= Pitaz,; — Pi-Az,; = {2Ax,0,2Ax: £1 (12.4) 
py= Pi,j+ay— Pi,;-ay= {0,2Ay,2Ay' fl (12.5) 
式 中 , 为 x 方向 高 程 变 化 率 ;为 y 方向 高 程 变化 率 。 基 本 矢量 p,、p, 完全 确 
定 了 微分 单元 在 空间 的 特征 ,由 p,、p, 可 得 地 表 微分 单元 法 矢量 nn;: 
i J 天 
2Az 0 2Azr:f 
0 2Ay 2Ay ' 万 
= {—-4Ax :Ay:f.， -4Ax.: Ay* 万， 4AzAy| 
fs by, 二 于 (12.6) 

根据 法 矢量 n; ,就 可 以 完成 微观 地 形 因子 的 自动 提取 。 实 际 进 行 坡 面 因 子 分 

析 时 ,对 于 和 了 的 计算 通常 采用 简化 的 差分 原理 求 得 。 


2. 基于 空间 矢量 模型 的 差分 计算 


由 式 (12.6) 知 ,求解 n; ,关键 是 求解 f, 和 了 ,可 以 用 以 求解 f. 入 的 算法 很 

多 ,主要 有 数值 分 析 法 、 局 部 曲面 拟 合算 法 、 空 间 矢 量 法 、 快 速 侍 里 叶 变 换 等 (图 

12.19)。 其 中 数值 分 析 方 法 中 差分 算法 原理 简洁 、 明 确 , 非 常 适合 棚 格 DEM 数据 

结构 。 考 虑 到 地 面 高 程 的 相关 性 ,在 数值 差分 分 析 或 曲面 拟 合 分 析 时 ,有 时 要 考虑 
局 部 窗口 中 周围 点 对 中 心 点 的 影响 , 即 权 的 问题 ,常用 定 权 方法 是 反 距 离 权 : 

p=1/D™ (12.7) 


ni; = pr Xx py = 
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式 中 :m 为 任意 常数 ,一 般 取 1 或 2;D 为 分 析 窗 口中 周围 点 到 中 心 点 的 距离 , 取 值 
为 d 或 (24d( 设 格 网 间距 为 4)。 
l 简单 差分 算法 (Simple Difference) 








二 阶 差分 (2rdFinite Difference) 
MA 三 阶 差分 (3"Finite Difference) Hd ey 
Frame 差分 (Frame Finite Difference) 
线性 回归 平面 
地 表 法 矢量 的 提取 模型 带 权 
他 | 0 
局 部 曲面 拟 合算 法 4 二 次 曲面 
| 带 权 
非 限制 不 带 权 
不 完全 四 次 曲面 
空间 矢量 法 
快速 傅 里 叶 变换 


图 12.19 DEM 提取 地 表 法 矢量 的 数学 模型 (刘学军 ,2002) 


围绕 差分 原理 产生 了 多 种 计算 f, 和 f， 1j 1， (LD LD) 
方法 ,如 图 12.20 所 示 , 设 中 心 格 网 点 为 
(i,j) ,相应 坐标 为 (zi, y;) ,局 部 地 形 曲 面 设 Cal 
为 z= f(xz,y),d 为 格 网 间距 , 则 在 (i,j) 处 
的 Taylor 级 数 展开 式 为 ( 取 至 一 次 项 ): 
f(zxit kd,y;t+kd)= f(zxi,y) t+ kdf + kdf, 

(12.8) 

式 中 ,k(k= 一 1,0,1) 为 展开 范围 ,按照 不 同 的 取 值 和 定 权 方式 ,将 产生 不 同 的 
和 计算 模型 。 目 前 常用 的 是 二 阶 差 分 和 三 阶 反 距离 平方 权 差 分 。 它 们 的 解 
算 公 式 如 下 : 

对 二 阶 差分 ,= 一 1,k=1, 在 中 心 网 格 (i,j) 的 前 后 两 点 为 展开 范围 ,有 

fx; 二 qd ,y;) — f(x; —d,y;) Zi+lJ Zi-1,j 





{itl, 产 1) (itl,)) (itl, J+1) 
图 12.20 ”差分 DEM 计算 示意 图 


jf 4 Te (12.9) 
_flzisytd)- f(ri,y—d) Ci,j+1™ Ti,j—1 
= = (12.10) 


式 中 ,4d 为 DEM 栅 格 大 小 。 对 三 阶 反 距离 平方 权 差分 , p = 17ZD“ ,考虑 了 不 同 距 
离 上 的 点 对 中 心 格 网 点 人 篇 导数 计算 的 影响 。 可 以 得 到 
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(12.11) 
3. 提取 坡 面 因 子 的 常用 分 析 窗 口 


窗口 分 析 ( 邻 域 分 析 ) 是 在 DEM 数据 中 提取 坡 面 信息 的 主要 分 析 方法 , 它 的 基本 
原理 是 :对 栅 格 数据 系统 中 的 一 个 、 多 个 栅 格 点 或 全 部 数据 ,开辟 一 个 有 固定 分 析 半 径 
的 分 析 窗 口 ,并 在 该 窗口 内 进行 诸如 极 值 .均值 .标准 差 等 一 系列 统计 计算 ,或 进行 差分 
及 与 其 他 层面 信息 的 复合 分 析 等 ,实现 栅 格 数据 有 效 的 水 平方 向 扩展 分 析 。 在 坡 面 信 
息 提 取 中 ,按照 分 析 和 窗口 的 形状 ,可 以 将 分 析 窗 口 划分 为 以 下 4 类 (图 12.21)。 





环形 窗口 扇形 窗口 


图 12.21 分 析 窗 口 的 类 型 


(1) 矩形 窗口 :以 目标 机 格 为 中 心 ,分 别 向 周围 8 个 方向 扩展 一 层 或 多 层 机 
格 , 从 而 形成 如 图 12.21 中 所 示 的 矩形 分 析 区 域 ; 

(2) 圆 形 窗口 :以 目标 栅 格 为 中 心 , 向 周围 作 一 等 距离 搜索 区 ,构成 一 圆 形 分 
析 窗 口 ; 

(3) 环形 窗口 :以 目标 栅 格 为 中 心 , 按 指定 的 内 外 半径 构成 环形 分 析 窗 口 ; 

(4) 扇形 窗口 :以 目标 栅 格 为 中 心 , 按 指定 的 起 始 和 终止 角度 构成 扇形 分 析 窗 口 。 

和 矩形 窗口 最 为 常用 ,一 般 采 用 3x3 位 基本 分 析 窗 口 ,然而 ,按照 分 析 的 需要 ， 
分 析 窗 口 也 可 以 扩大 为 5x5、7x7 或 更 大 (图 12.22)。 

此 外 ,在 坡 面 因 子 的 提取 中 ,也 使 用 栅 格 追 踪 分 析 方 法 。 所 谓 追 踪 分 析 , 指 对 
于 特定 的 栅 格 数据 系统 ,由 某 一 个 或 多 个 起 点 按照 一 定 的 追踪 线索 进行 追踪 目标 


第 12 章 地 形 分 析 算 法 . 239 . 














图 12.22 不 同 大 小 的 分 析 窗 口 


或 追踪 轨迹 信息 的 空间 分 析 方 法 。 例 如 ,在 坡 长 提取 中 ,根据 水 流 方向 信息 , 常 采 
用 逆水 流 方向 或 顺水 流 方向 追踪 水 流 轨迹 ,从 而 提取 坡 长 信息 。 


12.2.2 坡度 、 坡 向 


坡 面 姿态 (坡度 及 坡 向 ) 是 指 局 部 地 表 坡 面 在 空间 的 倾斜 程度 和 朝向 。 
1. 坡度 的 提取 


严格 地 讲 , 地 表面 任 一 点 的 坡度 是 指 过 该 点 的 切 平面 与 水 平地 面 的 夹 角 。 坡 
度 表示 了 地 表面 在 该 点 的 倾斜 程度 ,在 数 
值 上 等 于 过 该 点 的 地 表 微 分 单元 的 法 矢 
量 n 与 z 轴 的 夹 角 (图 12.23) , 即 


Slope= arccos( ol ) 


(12.12) 六 


当 具 体 进行 坡度 提取 时 , 常 采 用 简化 
的 差分 公式 ,完整 的 数学 表示 为 

Siope= arctanV f+ f3 X180/n 

(12.13) 

式 中 ,为 z 方向 高 程 变化 率 ;了 为 y 方 向 高 程 变 化 率 。 

地 面 坡 度 实质 是 一 个 微分 的 概念 ,地 面 上 每 一 点 都 有 坡度 , 它 是 一 个 微分 点 上 
的 概念 ,是 地 表 曲 面 函 数 z = f(xz,y) 在 东西 .南北 方向 上 的 高 程 变 化 率 的 函数 。 
实际 应 用 中 ,坡度 有 两 种 表示 方式 (图 12.24)。 

(1) 坡度 (degree of siope) : 即 水 平面 与 地 形 面 之 间 夹 角 ; 

(2) 坡度 百分比 (percent of slope) : 即 高 程 增 量 (rise) 与 水 平 增 量 (run) 之 比 的 
百分数 。 





图 12.23 ”地 表单 元 坡度 示意 图 
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degree of slope = 0 percent of slope = Tse x100 
rise 
nm 0 
AAA i rise 
人 A 
(a) (9 
degree of slope = 30 76 
percent of slope = 58 373 





图 12.24 坡度 的 两 种 表示 方法 
2. 坡 向 的 提取 


坡 向 定义 为 :地 表面 上 一 点 的 切 平面 的 法 线 矢量 n 在 水 平面 的 投影 no, 与 过 
该 点 的 正 北方 向 的 夹 角 (如 表 12.4 中 的 坡 向 示意 图 所 示 ,z 轴 为 正 北方 向 )。 其 数 
学 表达 公式 为 
Aspect=arctan (2) (12.14) 
£ | 


I 


对 于 地 面 任何 一 点 来 说 , 坡 向 表征 了 该 点 高 程 值 改 变量 的 最 大 变化 方向 。 在 
输出 的 坡 向 数据 中 , 坡 向 值 有 如 下 规定 : 正 北方 向 为 0", 按 顺 时 针 方 向 计算 , 取 值 
范围 为 0" 一 360"。 

坡 向 可 在 DEM 数据 中 用 式 (12.14) 直 接 提 取 。 但 应 注意 ,由 于 式 (12.14) 求 
出 坡 向 有 与 x 轴 正 向 和 xz 轴 负 向 夹 角 之 分 ,此 时 就 要 根据 f. 入 的 符号 来 进 一 
步 确定 坡 向 值 ( 表 12.4)。 

表 12.4 坡 向 值 的 判断 




















注 : 上 述 情况 假定 所 建立 的 DEM 数据 从 南 向 北 获取 的 , 且 x 轴 与 正 北 方向 重合 ,否则 上 述 公式 求 得 的 
坡 向 值 , 还 应 加 上 z 轴 偏 离 正 北方 向 的 夹 角 值 。 
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12.2.3 坡 形 


坡 形 是 指 局 部 地 表 坡 面 的 曲折 状态 。 宏 观 上 讲 ,一 般 可 分 为 直线 形 斜坡 、 凸 形 
斜坡 、 媚 形 斜坡 和 台阶 形 斜坡 四 种 基本 类 型 。 从 微观 角度 上 ,一 般 可 采用 地 面 曲率 
因子 和 地 面 变 率 因子 度量 地 面 表面 一 点 的 弯曲 变化 程度 。 


1. 宏观 坡 形 因子 


宏观 上 坡 形 大 体形 态 如 图 12.25 所 示 。 

(1) 直线 形 斜坡 :从 分 水 岭 到 斜坡 底部 地 面 坡度 基本 上 不 变 。 

(2) 凸 形 斜坡 :地 面 坡度 随 着 距 分 水 岭 距 离 增加 而 增加 。 邻 近 分 水 岭 附 近 的 
地 面 平 缓 ,以 后 随 坡 长 的 增加 ,坡度 亦 增加 。 

(3) 四 形 斜坡 :斜坡 上 半 部 坡度 较 陡 , 下 半 部 坡度 较 缓 。 此 种 坡 形 常 以 沉积 为 
主 , 较 多 分 布 在 山区 与 阶地 平原 接壤 处 或 河谷 的 两 岸 。 

(4) 台阶 形 斜坡 :台阶 形 斜坡 是 斜坡 与 阶地 相间 的 复式 ,可 以 看 作 是 凸 形 坡 与 
凹 形 坡 的 组 合 。 
































图 12.25 不 同 坡 形 的 坡 面 


自然 界 中 这 几 种 坡 形 往往 相互 结合 ,形成 一 些 复 杂 的 坡 面 。 如 果 一 面 坡 的 坡 
形 是 稳定 、 连 续 的 ,在 DEM 数据 的 支持 下 可 利用 窗口 分 析 中 的 邻 域 分 析 法 实现 对 
不 同 坡 面 坡 形 的 自动 获取 。 其 公式 为 
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(12.15) 


式 中 , 瓦 为 高 程 ;m 为 待 分 析 点 ;n 为 分 析 区 域内 m 的 邻 域 点 。 当 了 >0 时 , 坡 形 
为 凸 形 坡 ; 当 P=0 时 , 坡 形 为 直 形 坡 ; 当 P<0 时 , 坡 形 为 止 形 坡 。 


2. 地 面 曲率 因子 


地 面 曲率 是 对 地 形 表面 一 点 扭曲 变化 程度 的 定量 化 度量 因子 ,地 面 曲 率 在 水 
平和 垂直 两 个 方向 上 分 量 分 别称 为 平面 曲率 和 剖面 曲率 。 

剖面 曲率 是 对 地 面 坡度 的 沿 最 大 坡 降 方向 地 面 高 程 变化 率 的 度量 。 数 学 表达 
式 为 

ee (12.16) 
(pr+qg V1t+p tg 

平面 曲率 指 在 地 形 表面 上 ,具体 到 任何 一 点 已, 指 用 过 该 点 的 水 平面 沿 水 平方 
向 切 地 形 表面 所 得 的 曲线 在 该 点 的 曲率 值 (图 12.26)。 平 面 曲 率 描述 的 是 地 表 曲 
面 沿 水 平方 向 的 弯曲 、 变 化 情况 ,也 就 是 该 点 所 在 的 地 面 等 高 线 的 弯曲 程度 。 从 另 
一 个 角度 讲 , 地 形 表面 上 一 点 的 平面 曲率 也 是 对 该 点 微小 范围 内 坡 向 变化 程度 的 
度量 。 数 学 表达 式 为 





2z 
水 平方 向 切 地 表面 所 得 曲线 





图 12.26 平面 曲率 示意 图 


2 —2pgs + pt 

了 = 一 一 人 12.17 

0 J 
曲率 数学 表达 式 中 ,我 们 利用 离散 的 DEM 数据 把 地 表 曲 面 数学 模拟 为 一 个 

连续 的 曲面 H(z ,y),x 和 >y 为 地 面 点 的 平面 坐标 值 , H(z ,y) 为 地 面 点 高 程 值 ， 


式 中 其 他 符号 所 表示 的 意义 为 
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p= 了, 是 工 方向 高 程 变化 率 ， 
9= 3 ,是 y 方向 高 程 变化 率 ; 
-= 了 如 ,对 高程 什 在 z 方向 上 的 变化 率 进行 同方 向 求 算 变 化 率 , 即 x 方向 高 
程 变化 率 的 变化 率 ; 
2 ,对 高 程 值 在 z 方向 上 的 变化 率 进行 y 方向 上 求 算 变 化 率 , 即 zx 广 


azgy” 
向 高 程 变化 率 在 y 方向 的 变化 率 ; 
2 

t = ,对 高 程 信 在 y 方向 上 的 变化 率 同方 向 上 求 算 变化 率 , 即 y 方向 高 程 
变化 率 的 变化 率 。 

曲率 因子 的 提取 算法 的 基本 原理 为 :在 DEM 数据 的 基础 上 ,根据 其 离散 的 高 
程 数值 ,把 地 表 模拟 成 一 个 连续 的 曲面 ,从 微分 几何 的 思想 出 发 ,模拟 曲面 上 每 一 
点 所 处 的 垂直 于 和 平行 于 水 平面 的 曲线 ,利用 曲线 曲率 的 求 算 方法 的 推导 得 出 各 
个 曲率 因子 的 计算 公式 。 利 用 公式 求 算 出 每 一 点 的 曲率 值 的 关键 在 于 确定 得 出 式 
中 各 个 参量 的 值 ,在 DEM 中 求 算 高 程 的 微分 分 量 有 一 套 独特 的 算法 ( 见 12.2.1) 
坡 面 因子 数学 表达 的 算法 基础 ,这 里 采用 最 常用 的 一 种 三 阶 反 距离 平方 权 差 分 算 
法 , 简 述 其 计算 的 基本 步 又。 对 每 一 个 栅 格 点 都 确定 一 个 3x3 的 以 分 析 栅 格 点 为 
中 心 的 模板 分 析 窗 口 ,如 图 12.27 所 示 。 





一 





高 程 分 析 窗 口 了 值 分 析 窗 口 4 值 分 析 密 口 
图 12.27 提取 地 面 曲 率 的 分 析 窗 口 


图 12.27 中 a,6b,c,d,e,f,g,h,i 分别 代 表 各 个 栅 格 元 的 高 程 值 。 
则 有 : 
_9H_ (a+2d+g)—(c+2f+1) 





ax 8.Cellsize (12.18) 
_9H (a+2b+c)-(g+2h+i) 
a 8- Callsize (12.19) 


式 中 ,Cellsize 为 李 格 格 网 间距 。 
将 请 和 qd 值 求 算 出 之 后 ,分 别 组 成 两 个 栅 格 矩阵 p 值 矩 阵 和 4g 值 矩 阵 。 此 
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时 ,以 p 值 矩 阵 和 gq 值 矩 阵 为 基础 数据 ,按照 上 述 p、g 值 求解 过 程 再 次 进行 差分 
运算 ,就 可 以 得 到 对 地 表 曲 面 H= f(z ,y) 的 二 次 导数 1、 Sto 
PH_(al 12 +) (+2 放 二 这) 








0 SC W220) 
PH (ar +2br ter )- (gr +2h; 十 让 ) 

”gray . 8.Cellsize (12.21) 
HH (ay +2b +cy )- (gy +2hy +iy ) 

a 8° Cellsize W202) 


将 由 上 面 计算 公式 得 到 的 结果 值 代入 曲率 的 计算 公式 即 得 到 曲率 结果 。 完 整 
的 计算 步骤 流程 如 图 12.28 所 示 。 







(a! +2d, + g!)-(c! +2f! +i!) 
8. Cellsize 


s+2br ter)— (gs +2he +ir) 
8 .Cellsize 





CR 
四 8° Cellsize 


图 12.28 地 面 曲 率 提取 步 又 流程 图 


12.3 地形 特征 提取 算法 


特征 地 形 要 素 ,主要 是 指 对 地 形 在 地 表 的 空间 分 布 特征 具有 控制 作用 的 点 、 线 
或 面 状 要 素 。 特 征地 形 要 素 构 成 地 表 起 伏 变化 的 基本 框架 。 
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12.3.1 地 形 特 征 点 的 提取 


地 形 特 征 点 主要 包括 山顶 点 (peak)、 凹 陷 点 (pit)、 峭 点 (ridge)、 谷 点 (chan- 
nel) 、 鞍 点 (pass) ,平地 点 (plane) 等 。 利 用 DEM 提取 地 形 特征 点 ,可 通过 一 个 3x3 
或 更 大 的 栅 格 窗口 ,通过 中 心 格 网 点 与 8 个 邻 域 格 网 点 的 高 程 关系 来 进行 判断 获 
取 。 即 在 一 个 局 部 区 域内 ,用 x 方向 和 y 方向 上 关于 高 程 z 的 二 阶 导 数 的 正 负 组 
合 关系 来 判断 ( 表 12.5)。 


表 12.5 地 形 特 征 点 类 型 的 判断 











































邻 域 高 程 关系 
a 2 2 
\ 值 点 2 2 
凹陷 点 (pit) | 0 2 <0 
es de a | 





表 12.5 中 的 关于 地 形 特征 点 的 判断 是 在 局 部 区 域内 利用 zx、y 方向 的 凹凸 性 
判断 的 ,该 判断 法 十 分 适合 利用 在 DEM (Li-D) (LD) tl) 
上 判断 地 形 特征 点 。 在 DEM 中 可 以 利用 


2 2 2 
差分 的 方法 得 到 2 训 和 5 的 值 (关于 2 GD 


CA+D 





2 
和 -的 计算 可 参见 12.2.3 地 面 曲率 因 
了 


子 算法 的 介绍 ) 。 除 上 述 算法 外 ,在 一 个 
3x3 的 棚 格 窗口 中 ,也 可 以 直接 利用 中 图 12.29 差分 算法 示意 图 
心 格 网 点 与 8 个 邻 域 格 网 点 的 高 程 关系 
来 进行 判断 地 形 特征 点 。 具 体 方法 为 

假设 有 一 个 如 图 12.29 所 示 的 3x3 窗口 。 则 

如 果 (2Zi,;-1 一 2i,;)(Zi,j+1 一 2i,;)>0 

(1) 当 Zi,j+1>2,; 则 VR(i,j)= 一 1 


(it1, /~-1) (itl,7)) (itl,j+1) 


. 246 ， 地 理 信息 系统 算法 基础 








(2) 当 Zi,j+1< Zi,j 则 VR(i,j)=1 

如 果 (Z;-_1,; 一 2i,;)(Zi+1,; 一 2i,;)>0 

(3) 当 Zi+1,j>2i,; 则 VR(i,j)= = 

(4) 当 Zit1,j<2i, 则 VR(i,j)=1 

如 果 (1) 和 (4) 或 (2) 和 (3) 同 时 成 立 , 则 VR(i,j)=2 
如 果 以 上 条 件 都 不 成 立 , 则 VR(i,j)=0 

一 1, 表 示 谷 点 

1 ,表示 兰 点 

2 ,表示 鞍点 

0, 表 示 其 他 点 


12.3.2 基于 规则 格 网 DEM 数据 提取 山 着 与 山谷 线 的 典型 算法 


其 中 VR(i,j)= 


1. 基于 图 像 处 理 技术 原理 的 算法 


因为 规则 格 网 DEM 数据 事实 上 是 一 种 栅 格 形式 的 数据 ,可 以 利用 数字 图 像 
处 理 中 的 技术 来 设计 算法 。 利 用 数字 图 像 处 理 技术 设计 的 算法 大 都 采用 各 种 滤波 
算 子 进行 边缘 提取 。 这 种 方法 提取 山 消 山谷 线 的 主要 过 程 有 两 步 ， 

(1) 首先 提取 地 形 特征 点 ( 山 消 点 、 山 谷 点、 鞍点 等 ); 

(2) 将 特征 点 连 成 地 形 特征 线 ( 山 消 线 、 山 谷 线 )。 

T.K. Pecuker 和 D.H. Douglas 于 1975 年 提出 了 一 种 简单 移动 窗口 的 算法 。 
其 算法 的 主要 思路 是 : 

(1) 设计 一 个 2x2 窗口 以 对 DEM 格 网 阵列 进行 扫描 ; 

(2) 第 一 次 扫描 中 ,将 窗口 中 的 具有 最 低 高 程 值 的 点 进行 标记 ,自始至终 未 被 
标记 的 点 即 为 山脊 线 上 的 点 ; 

(3) 第 二 次 扫描 中 ,将 窗口 中 的 具有 最 高 高 程 值 的 点 进行 标记 , 自始至终 未 被 
标记 的 点 即 为 山谷 线 上 的 点 。 

扫描 结束 后 ,DEM 中 可 能 的 特征 点 就 被 提取 出 来 了 。1986 年 ,L.E. Band 对 
这 一 算法 进行 了 改进 ,采用 标识 河流 段 上 下 游 的 顶点 并 进行 细 化 处 理 的 方法 将 特 
征 点 连接 成 了 特征 线 。 以 上 方法 存在 两 个 主要 缺陷 : 

(1) 提取 特征 点 时 必须 排除 DEM 中 噪声 的 影响 ; 

(2) 将 特征 点 连接 成 线 时 的 算法 设计 较为 困难 。 


2. 基于 地 形 表 面 几 何 形态 分 析 原 理 的 算法 


基于 地 形 表面 几何 形态 分 析 原 理 的 典型 算法 就 是 断面 极 值 法 。 其 基本 思想 就 
是 地 形 断 面 曲线 上 高 程 的 极 大 值 点 就 是 分 水 点 ,而 高 程 的 极 小 值 点 就 是 汇 水 点 。 
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该 方法 的 基本 过 程 为 : 

(1) 找 出 DEM 的 纵向 与 横向 的 两 个 断面 上 的 极 大 、 极 小 值 点 ,作为 地 形 特征 
线 上 的 备 选 点 ; 

(2) 根据 一 定 的 条 件 或 准则 将 这 些 备 选 点 划 归 各 自 所 属 的 地 形 特征 线 。 

这 种 算法 存在 两 个 主要 缺陷 : 

(1) 由 于 这 种 方法 对 地 形 特征 线 上 的 点 的 判定 与 其 所 属 的 地 形 特 征 线 的 判定 
是 分 开 进 行 的 ,在 确定 地 形 特征 线 时 ,全 区 域 采用 一 个 相同 的 曲率 阐 值 作为 判定 地 
形 特 征 线 上 点 的 条 件 。 因 此 , 它 忽 略 了 每 条 地 形 特征 线 必然 存在 的 曲率 变化 现象 。 
当 阔 值 选择 较 大 时 ,会 丢失 许多 地 形 特征 线 上 的 点 ,导致 后 续 跟 踪 的 地 形 特征 线 间 
断 且 较 短 ;如 果 选 择 过 小 ,会 产生 地 形 特征 线 上 点 的 误 判 , 给 后 续 地 形 特 征 线 的 跟 
踪 带 来 困难 。 

(2) 由 于 该 方法 只 选择 纵 、 横 两 个 断面 来 去 确定 高 程 变化 的 极 值 点 ,因此 它 所 
确定 的 地 形 特征 线 具 有 一 定 的 近似 性 ,与 实际 的 地 形 特 征 线 有 一 定 的 差异 ,有 时 候 
还 会 出 现 遗 漏 。 因 此 ,有 学 者 提出 在 提取 地 形 特 征 点 的 时 候 , 增 加 规则 格 网 对 角 线 
方向 上 的 一 组 断面 ,以 助 于 解决 这 一 问题 。 


3. 基于 地 形 表面 流水 物理 模拟 分 析 原 理 的 算法 


这 种 算法 的 基本 思想 是 :按照 流水 从 高 至 低 的 自然 规律 ,顺序 计算 每 一 栅 格 点 
上 的 汇 水量 , 然 后 按 汇 水 量 单调 增加 的 顺序 ,由 高 到 低 找 出 区 域 中 的 每 一 条 汇 水 
线 。 根 据 得 到 的 汇 水 线 ,通过 计算 找 出 各 自 汇 水 区 域 的 边界 线 , 就 得 到 了 分 水 线 。 
这 一 算法 采用 了 DEM 的 整体 追踪 分 析 的 思路 与 方法 ,分 析 结 果 具 有 系统 性 好 ,还 
便于 进行 相应 的 径流 成 因 分 析 。 但 是 ,该 方法 也 存在 以 下 两 个 明显 的 缺陷 : 

(1) 由 于 该 算法 所 计算 的 汇 水 量 与 高 程 有 关 , 计 算 的 结果 必然 是 高 程 值 大 的 
地 形 特征 线 上 的 点 的 汇 水 量 小 ,高程 值 小 的 地 形 特征 线 上 的 点 的 汇 水 量 大 。 因 此 ， 
可 能 导致 低 处 非 地 形 特征 线 上 的 点 的 汇 水 量 也 较 大 而 被 误 认 为 地 形 特征 线 上 的 
点 ;而 位 于 高 处 的 地 形 特 征 线 上 的 点 会 因为 汇 水 量 小 而 被 排除 ;这 就 造成 用 该 算法 
所 确定 的 地 形 特 征 线 ( 汇 水 线 ) 的 两 端 效 果 很 差 。 

(2) 由 于 该 算法 将 汇 水 区 域 的 公共 边界 视 为 分 水 线 , 因 此 它 所 确定 的 分 水 线 
均 为 闭合 曲线 ,这 与 实际 的 地 形 特 征 线 ( 山 疹 线 ) 不 符 。 
4. 基于 地 形 表面 几何 形态 分 析 和 流水 物理 模拟 分 析 相 结合 的 算法 

由 于 基于 地 形 表面 几何 形态 分 析 原 理 和 基于 地 形 表面 流水 物理 模拟 的 算法 均 
存在 一 定 的 缺陷 ,因此 有 些 学 者 提出 将 两 者 结合 起 来 以 实现 地 形 特 征 线 的 提取 。 


这 种 算法 的 基本 思路 是 :首先 采取 较 稀 疏 的 DEM 格 网 数据 , 按 流水 物理 模拟 算法 
去 提取 区 域内 概略 的 地 形 特 征 线 ;然后 用 其 引导 ,在 其 周围 邻近 区 域 对 地 形 进行 几 
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何 分 析 ,来 精确 地 确定 区 域 的 地 形 特征 线 。 

这 一 算法 的 关键 在 于 : 求 出 已 提取 的 概略 的 地 形 特 征 线 与 DEM 格 网 线 的 交 
点 ,在 该 交点 附近 的 一 个 小 区 域内 ,对 DEM 数据 进行 几何 分 析 , 即 找 出 该 区 域内 
与 概略 的 地 形 特征 线 正 交 方向 地 形 断 面 上 高 程 变 化 的 极 值 点 ,该 点 即 为 地 形 特 征 
线 的 精确 位 置 。 这 一 算法 的 基本 过 程 可 归纳 为 :QD 概略 DEM 的 建立 ;@ 地 形 流 
水 物理 模拟 ;@@ 概略 地 形 特征 线 提取 ;@ 地 形 几何 分 析 ;@) 地 形 特征 线 精确 确定 。 


12.4 通 视 分 析 算 法 


可 视 性 分 析 也 称 通 视 分 析 , 它 实质 属于 对 地 形 进行 最 优化 处 理 的 范畴 。 比 如 ， 
设置 雷达 站 、 电 视 台 的 发 射 站 .道路 选择 .航海 导航 等 ,在 军事 上 如 布设 阵地 (如 炮 
兵 阵地 、 电 子 对 抗 阵地 )、 设 置 观察 哨所 、 铺 架 通信 线路 等 。 

可 视 性 分 析 的 基本 因子 有 两 个 ,一 个 是 两 点 之 间 的 通 视 性 (intervisibility), 另 
一 个 是 可 视 域 (viewshed) , 即 对 于 给 定 的 观察 点 所 覆盖 的 区 域 。 


12.4.1 判断 两 点 之 间 的 可 视 性 的 算法 


比较 常见 的 一 种 算法 基本 思路 如 下 : 

(1) 确定 过 观察 点 和 目标 点 所 在 的 线段 与 XY 平面 垂直 的 平面 S ; 

(2) 求 出 地 形 模 型 中 与 平面 S 相交 的 所 有 边 ; 

(3) 判断 相交 的 边 是 否 位 于 观察 点 和 目标 点 所 在 的 线段 之 上 , 如果 有 一 条 边 
在 其 上 , 则 观察 点 和 目标 点 不 可 视 。 

另 一 种 算法 是 “射线 追踪 法 ”。 这 种 算法 的 基本 思想 是 对 于 给 定 的 观察 点 V 
和 某 个 观察 方向 ,从 观察 点 V 开始 沿 着 观察 方向 计算 地 形 模型 中 与 射线 相交 的 第 
一 个 面 元 ,如 果 这 个 面 元 存在 , 则 不 再 计算 。 显 然 , 这 种 方法 既 可 用 于 判断 两 点 相 
互 间 是 否 可 视 , 又 可 以 用 于 限定 区 域 的 水 平 可 视 计 算 。 

以 上 两 种 算法 对 于 基于 规则 格 网 地 形 模型 和 基于 TIN 模型 的 可 视 分 析 都 适 
用 。 对 于 线 状 地 物 和 面 状 地 物 , 则 需要 确定 通 视 部 分 和 不 通 视 部 分 的 边界 。 


12.4.2 计算 可 视 域 的 算法 


计算 可 视 域 的 算法 对 于 规则 格 网 DEM 和 基于 TIN 的 地 形 模 型 则 有 所 区 别 。 
基于 规则 格 网 DEM 的 可 视 域 算法 在 GIS 分析 中 应 用 较 广 。 在 规则 格 网 DEM 中 ， 
可 视 域 经 常 是 以 离散 的 形式 表示 ,即将 每 个 格 网 点 表示 为 可 视 或 不 可 视 ,这 就 是 所 
谓 的 “可 视 和 矩阵 ”。 
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计算 基于 规则 格 网 DEM 的 可 视 域 ,一 种 简单 的 方法 就 是 沿 着 视线 的 方向 ,从 
视点 开始 到 目标 格 网 点 ,计算 与 视线 相交 的 格 网 单元 ( 边 或 面 ) ,判断 相交 的 格 网 单 
元 是 否 可 视 , 从 而 确定 视点 与 目标 视点 之 间 是 否 可 视 。 显 然 ,这 种 方法 存在 大 量 的 
宛 余 计算 。 总 的 来 说 ,由 于 规则 格 网 DEM 的 格 网 点 一 般 都 比较 多 ,相应 的 时 间 消 
耗 比较 大 。 针 对 规则 格 网 DEM 的 特点 ,比较 好 的 处 理 方法 是 采用 并 行 处 理 。 

基于 TIN 地 形 模型 的 可 视 域 计 算 一 般 通过 计算 地 形 中 单个 的 三 角形 面 元 可 
视 的 部 分 来 实现 。 实 际 上 基于 TIN 地 形 模 型 的 可 视 域 计算 与 三 维 场景 中 的 隐藏 
面 消 去 问题 相似 ,可 以 将 隐藏 面 消 去 算法 加 以 改进 ,用 于 基于 TIN 地 形 模型 的 可 
视 域 计算 。 

可 视 区 分 析 不 仅 显示 了 在 一 个 区 域内 从 一 个 或 多 个 观察 点 可 以 观察 到 的 区 域 
范围 ,而 且 显 示 了 对 于 一 个 可 视 位 置 , 有 多 少 观察 点 可 以 看 到 此 位 置 。 


思 考 题 


1. 简 述 如 何 实 现 不 同 结构 数字 地 面 模型 相互 转换 的 技术 路 线 和 方法 。 

2. 说 明 坡 面 因子 提取 的 主要 算法 依据 及 其 优 缺点 。 

3. 试用 有 关 地 理 信息 系统 软件 及 DEM 数据 提取 各 坡 面 因子 ,并 比较 对 于 同 
种 坡 面 因子 各 软件 所 用 算法 是 否 相同 。 

4. 简 述 利用 规则 格 网 DEM 提取 地 形 特征 线 ( 山 硝 线 山谷 线 ) 的 各 种 算法 优 
缺点 ? 

5. 说 明 通 视 性 算法 的 主要 依据 。 


第 13 章 “空间 数据 挖掘 算法 
13.1 概 述 


随 着 计算 机 与 信息 技术 的 飞速 发 展 ` 因 特 网 (Internet) 技 术 应 用 的 普及 ,人 们 
获取 和 存储 数据 的 方式 变 得 更 加 快捷 与 廉价 ,致使 现在 的 数据 和 信息 量 以 空前 的 
速度 急剧 增长 。 作 为 一 种 资源 ,数据 只 不 过 是 人 们 用 各 种 工具 和 手段 观察 外 部 世 
界 所 得 到 的 原始 材料 ,更 有 价值 的 是 蕴藏 在 其 中 的 信息 和 知识 。 因 此 ,无 论 数据 有 
多 么 大 ,如 何 从 数据 中 获取 有 用 的 知识 才 是 最 根本 的 。 在 前 几 年 ,一 个 称 为 "数据 
发 据 " 和 “数据 库 知 识 发 现 " 的 新 领域 因此 得 到 了 快速 发 展 。 

地 理 系统 是 由 多 种 要 素 相 复合 而 构成 的 复杂 巨 系 统 。 空 间 数据 挖掘 为 定性 、 
定量 地 揭示 地 理 系统 中 各 种 要 素 之 间 的 联系 ,以 及 各 种 地 理事 物 ,现象 所 表现 出 来 
的 地 域 分 异 规律 提供 了 强 有 力 的 工具 。 


13.2 分 类 算法 
13.2.1 数据 分 类 的 基本 过 程 


数据 分 类 一 般 分 两 步 实现 :第 一 步 ,对 一 个 类 别 已 经 确定 的 数据 集 创 建 模型 。 
用 于 创建 模型 的 数据 集 称 为 训练 集 ,训练 集中 单个 元 组 称 为 训练 样本 。 训 练 集 中 
每 一 个 元 组 都 属于 一 个 确定 的 类 别 ,类 别 用 类 标号 标识 。 第 二 步 ,使 用 创建 的 模型 
将 类 别 未 知 的 元 组 归 人 某 个 或 某 几 个 类 中 。 使 用 模型 进行 分 类 需要 评估 分 类 模型 
的 预测 准确 率 。 评 估 方 法 有 多 种 ,通常 使 用 创建 的 模型 在 一 个 测试 集 上 进行 预测 ， 
并 将 结果 与 实际 值 进行 比较 ,得 出 预测 准确 率 。 

数据 分 类 需要 进行 数据 准备 ,包括 数据 清洗 、 属 性 选择 数据 转换 等 处 理 过 程 。 
数据 清洗 的 任务 是 对 数据 进行 预 处 理 .消除 或 减少 噪声 ,处 理 空缺 值 。 属 性 选择 的 
任务 是 通过 相关 性 分 析 , 找 出 与 分 类 任务 相关 的 属性 ,去掉 那些 不 相关 的 或 者 元 余 
的 属性 ,以 提高 分 类 的 速度 ,防止 分 类 过 程 被 误导 。 数 据 转换 的 任务 是 对 数据 进行 
标准 化 或 者 对 数据 进行 泛 化 。 

评估 分 类 模型 可 以 根据 下 列 标准 来 进行 :预测 准确 率 ; 模 型 的 创建 速度 和 使 用 
速度 ;强壮 性 , 即 模型 对 具有 噪声 或 空缺 值 的 数据 的 适应 能 力 ;伸缩 性 ,数据 大 量 增 
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加 时 模型 的 适应 能 力 ; 可 解释 性 ,对 模型 的 可 理解 程度 。 
13.2.2 决策 树 分 类 概述 


决策 树 (decision tree) 方 法 是 应 用 最 广泛 的 归纳 学 习 , 特 别 是 在 专家 系统 、 工 
业 过 程控 制 、 金 融 保险 预测 等 领域 。 决 策 树 的 基本 组 成 部 分 有 :决策 结 点 、 分 支 和 
叶 , 树 中 每 个 内 部 结 点 表示 一 个 属性 上 的 测试 ,每 个 叶 结 点 代表 一 个 类 。 决 策 树 中 
最 上 面 的 结 点 称 为 根 结 点 ,是 整个 决策 树 的 开始 。 决 策 树 的 每 个 结 点 的 子 结 点 的 
个 数 与 决策 树 使 用 的 算法 有 关 。 例 如 ,有 的 算法 得 到 的 决策 树 每 个 结 点 有 两 个 分 
支 , 称 为 二 叉 树 。 人 允许 结 点 含有 多 于 两 个 子 结 点 的 树 称 为 多 叉 树 。 每 个 分 支 或 者 
是 一 个 新 结 点 ,或 者 是 树 的 叶 结 点 。 在 沿 着 决策 树 从 上 到 下 进行 搜索 的 过 程 中 ,在 
每 个 结 点 都 会 遇 到 一 个 问题 ,对 每 个 结 点 上 问题 的 不 同 回答 导致 不 同 的 分 支 , 最 后 
到 达 一 个 叶 结 点 。 这 个 过 程 就 是 利用 决策 树 进行 分 类 的 过 程 。 利 用 几 个 变量 可 以 
判断 元 组 所 属 的 类 别 ,其 中 每 个 变量 对 应 一 个 问题 ,每 个 叶 结 点 对 应 一 个 类 别 。 

决策 树 的 基本 算法 是 “贪心 "算法 , 它 采 用 自 上 而 下 分 而 治之 的 方法 。 开 始 时 ， 
所 有 的 数据 都 在 根 结 点 ,然后 用 所 选 属性 递归 地 对 元 组 集合 进行 分 裂 ,每 个 结 点 上 
的 数据 都 是 属于 同一 个 类 别 ,没有 属性 可 以 再 用 于 对 数据 进行 分 裂 时 停止 分 裂 。 
对 每 个 分 裂 都 要 求 分 成 的 组 之 间 的 “差异 "最 大 。 各 种 决策 树 算法 之 间 的 主要 区 别 
就 是 对 这 个 “差异 ”衡量 方式 的 区 别 。 属 性 的 选择 是 基于 一 个 启发 式 规则 或 者 一 个 
统计 的 度量 ,如 信息 粹 。 一 般 情 况 下 ,所 选 的 属性 都 是 分 类 属性 ,如 果 属 性 是 连续 
的 ,需要 将 其 离散 化 。 建 立 一 棵 决策 树 可 能 只 需要 对 数据 库 扫 描 几 遍 ,因此 决策 树 
模型 可 以 建 得 很 快 ,也 适用 于 对 大 型 数据 集 的 分 类 。 

决策 树 方法 既 可 用 于 解决 分 类 又 可 用 于 解决 回归 问题 。 解 决 分 类 问题 的 决策 
树 称 为 分 类 树 , 它 的 每 个 叶 结 点 给 出 一 个 预测 类 别 的 类 标签 值 。 解 决 回归 问题 的 
决策 树 称 为 回归 树 ,其 每 个 叶 结 点 可 能 是 常数 或 者 是 预测 输出 值 的 回归 方程 。 用 
决策 树 归 纳 的 方法 称 为 递归 分 裂 (recursive partitioning) 法 , 它 的 一 个 典型 代表 是 
既 可 分 类 又 可 回归 的 所 谓 分 类 回归 树 (classification and regression trees, CART)。 
CART 严 格 按照 二 又 树 归 纳 , 并 采用 再 抽样 技术 估计 误差 和 对 树 进 行 剪 枝 。 


13.2.3 决策 树 的 特点 


在 数据 挖掘 中 使 用 决策 树 对 数据 集 进行 分 类 有 伸缩 性 好 、 分 类 速度 比较 快 .分 
类 的 准确 率 较 高 .具有 相对 快捷 的 学 习 速 度 、 能 够 转换 成 容易 理解 的 分 类 规则 、 擅 
长 处 理 非 数 值 型 数据 、 0 
点 。 但 在 使 用 决策 树 方法 时 ,需要 注意 以 下 一 些 问题 。 
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(1) 在 为 一 个 结 点 选择 怎样 进行 分 裂 时 使 用 “贪心 "算法 ,这 种 算法 在 决定 结 
点 的 分 裂 时 根本 不 考虑 此 次 选择 会 对 将 来 的 分 裂 造成 什么 样 的 影响 。 换 名 话说 ， 
所 有 的 分 裂 都 是 顺序 完成 的 ,一 个 结 点 完成 分 裂 之 后 不 可 能 再 有 机 会 回 过 头 来 考 
察 此 次 分 裂 的 合理 性 ,每 次 分 裂 都 是 依赖 于 它 前 面 的 分 裂 结果 ,也 就 是 说 决策 树 中 
所 有 的 分 裂 都 受到 根 结 点 的 第 一 次 分 裂 的 影响 ,只 要 第 一 次 分 裂 稍 有 不 同 , 由 此 得 
到 的 整个 决策 树 就 会 完全 不 同 。 

(2) 通常 的 分 裂 算法 在 决定 怎么 在 一 个 结 点 进行 分 裂 时 ,都 只 考察 一 个 预测 
变量 。 这 样 生成 的 决策 树 使 得 有 些 原本 很 明确 的 情况 可 能 变 得 复杂 而 且 意 义 不 
清 , 为 此 ,目前 新 提出 的 一 些 算法 使 用 了 多 个 变量 来 决定 一 个 结 点 的 分 裂 。 

(3) 由 于 递归 地 分 裂 ,一些 数据 子 集 可 能 变 得 太 小 ,使 得 进一步 分 裂 它们 就 失 
去 了 统计 意义 。 可 以 引 和 人 一 个 异常 阐 值 来 规定 这 种 “无 意义 "的 数据 子 集 的 最 大 
尺寸 。 

(4) 决策 树 每 个 结 点 对 应 分 裂 的 定义 必须 非常 明确 ,不 能 含糊 ,但 在 实际 生活 
中 这 种 明确 可 能 是 不 合理 的 。 


13.2.4 二 又 决策 树 算 法 与 分 类 规则 的 生成 


决策 树 一 般 都 是 自 上 而 下 来 生成 的 。 建 立 决策 树 的 过 程 , 即 树 的 生长 过 程 ,是 
不 断 把 数据 按 一 定 规则 进行 分 裂 的 过 程 ,在 每 个 结 点 分 裂 使 用 一 个 相应 的 特征 ,使 
分 裂 后 某 种 准则 函数 达到 最 优 , 不 同 的 准则 对 应 不 同 的 分 裂 方 法 和 不 同 的 决策 树 。 
选择 分 裂 的 方法 有 好 几 种 ,但 是 目的 都 是 一 致 的 , 即 对 目标 类 尝试 进行 最 佳 的 分 
型。 当 准 则 函数 确定 后 ,二 又 树 CART 算法 的 基本 过 程 是 : 

(1) 开始 把 训练 数据 归 入 某 单 个 结 点 。 

(2) 选择 训练 数据 最 佳 分 类 的 一 个 检验 特征 值 进 行 数据 分 裂 , 然 后 进入 到 下 
一 个 结 点 。 

(3) 在 每 个 结 点 处 ,用 同样 的 办 法 递归 地 形成 下 一 个 分 裂 , 分 裂 过 的 特征 以 后 
不 再 考虑 。 

(4) 当下 列 条件 之 一 满足 时 ,递归 分 裂 停止 :中 不 再 有 可 进一步 分 裂 的 特征 ; 
@ 已 没有 样本 分 裂 某 个 检验 特征 。 

从 这 个 生长 过 程 看 ,决策 树 方法 实际 上 是 在 对 数据 库 中 的 大 量 数据 做 信息 量 
分 析 的 基础 上 提取 出 反映 类 别 的 重要 特征 。 

由 决策 树 生成 分 类 规则 ,可 以 用 IF-THEN 这 种 产生 式 形式 来 表现 规则 。 从 
根 到 叶 结 点 都 有 一 条 路 径 , 这 条 路 径 就 是 一 条 规则 。 生 成 规则 时 ,每 个 叶 结 点 都 创 
建 一 条 规则 ,每 个 分 裂 都 成 为 规则 中 的 一 个 条 件 , 叶 结 点 中 的 类 别 就 是 THEN 的 
内 容 。 分 类 规则 的 一 般 形式 为 
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IF (分 裂 条 件 1) AND (分 裂 条 件 2) AND … AND (分 裂 条 件 n) THEN 
《结论 》 

大 多 数 决 策 树 实现 方法 能 自动 地 进行 规则 的 创建 和 简化 过 程 。 一 旦 规则 被 简 
化 并 且 /或 者 被 淘汰 , 则 对 规则 进行 排序 以 最 大 限度 地 减少 错误 。 最 后 ,选择 一 个 
缺 省 规则 , 缺 省 规则 指出 一 个 实例 的 分 类 不 满足 任何 所 列 规则 的 前 提 条 件 。 


13.2.5 决策 树 分 类 算法 


一 个 典型 的 决策 树 生成 算法 是 ID3, 伪 代码 描述 如 下 。 

算法 一 :决策 树 生成 算法 Gen _Des _Tree。 

输入 :训练 样本 samples, 由 离散 值 属性 表示 ;候选 属性 的 集合 attribute _list。 

输出 :一 棵 决策 树 。 

方法 : 

(1) 创建 结 点 N; 

(2) If samples 都 在 同一 个 类 C Then A 开始 根 结 点 对 应 所 有 的 训练 样本 
返回 N 作为 叶 结 点 ,以 类 C 标 记 ; 

(3) If attribute _list 为 空 Then 返回 N 作为 叶 结 点 ,标记 为 samples 中 最 普通 
的 类 ; / 多数 表决 

(4) 选择 attribute _list 中 具有 最 高 信息 增益 的 属性 test _ attribute; 标记 结 点 
N 为 test_ attribute; 

(5) For 每 个 test _attribute 中 的 已 知 值 ai /准备 分 裂 结 点 N 所 包含 的 样 
本 集 samples 

由 结 点 N 长 出 一 个 条 件 为 test_ attribute = ai 的 分 支 ; /表示 测试 条 件 

(6) 设 si 是 samples 中 test _attribute = ai 的 样本 的 集合 ; /A 一 个 分 裂 

If si 为 空 Then 加 上 一 个 叶 结 点 ,标记 为 samples 中 最 普通 的 类 ; 

Else 加 上 一 个 由 Gen Des .Tree(si，attribute _ list test _ attribute) 返 回 的 
结 点 。 

Quinlan 在 以 上 ID3 算法 的 基础 上 又 进行 了 深入 的 研究 ,发 展 为 以 下 的 C4.5 
算法 。 

决策 树 的 创建 仅仅 使 用 最 能 区 分 所 学 概念 的 那些 属性 。 首 先 ,通过 从 训练 集 
中 选择 实例 的 一 个 子 集 来 创建 决策 树 。 然 后 ,算法 使 用 这 些 子 集 构建 一 个 决策 树 。 
剩 下 的 训练 集 实例 用 于 检验 所 建 决策 树 的 准确 度 。 如 果 决 策 树 能 正确 地 对 实例 进 
行 分 类 ,该 过 程 结 束 。 如 果 某 实例 的 分 类 有 误 , 则 该 实例 就 被 添加 到 所 选 训练 实例 
子 集中 ,并 构建 一 棵 新 树 。 该 过 程 继续 执行 ,直到 创建 了 一 个 能 正确 分 类 所 有 未 选 
实例 的 树 ,或 者 由 整个 训练 集 建 立 了 这 个 决策 树 。 下 面 给 出 了 C4.5 算法 的 简化 
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版 本 , 它 使 用 整个 训练 实例 集 来 创建 决策 树 。C4.5 算法 的 步骤 如 下 : 

(1) 假设 工 为 训练 实例 集 。 

(2) 选择 一 个 最 能 区 别 工 中 实例 的 属性 。 

(3) 创建 一 个 树 结 点 , 它 的 值 为 所 选择 的 属性 。 创 建 该 结 点 的 子 链 , 每 个 子 链 
代表 所 选 属性 的 一 个 唯一 值 。 使 用 子 链 的 值 ,进一步 将 实例 细 分 为 子 类 。 

(4) 对 于 步骤 (3) 所 创建 的 每 个 子 类 :中 如 果子 类 中 的 实例 满足 预定 义 的 标 
准 ,或 者 ,如 果树 的 这 条 路 径 的 剩余 可 选 属性 集 为 空 ,为 沿 此 决策 路 径 的 新 实例 指 
定 类 别 ;@ 如 果子 类 不 满足 预定 义 的 标准 并 且 至 少 有 一 个 属性 能 进一步 细 分 树 的 
路 径 , 设 工 为 当前 子 类 实例 集合 ,返回 步骤 (2)。 

C4.5 算 法 的 步骤 (4) 要 求 检 查 部 分 树 的 所 有 分 支 ,以 确定 是 否 需要 进一步 执 
行 树 的 创建 过 程 。 该 算法 说 明了 终止 树 的 一 条 路 径 的 两 种 可 能 性 。 首 先 ,如 果 沿 
着 一 个 给 定 分 支 的 实例 满足 一 个 预定 义 的 标准 。 例 如 ,分 支 满足 最 小 的 训练 集 分 
类 准确 度 ,该 分 支 就 成 为 一 条 终止 的 路 径 。 然 后 ,为 该 路 径 赋 予 最 频繁 出 现 类 的 
值 。 一 个 明显 的 终止 标准 是 沿 着 一 条 特定 路 径 的 所 有 实例 都 必须 来 自 相同 的 类 。 
终止 树 的 一 条 路 径 的 第 二 种 可 能 是 ,没有 一 个 属性 能 继续 树 的 分 裂 过 程 。 如 果 选 
择 了 一 个 分 类 属性 , 它 的 值 仅 能 对 树 分 裂 一 次 。 然 而 ,数值 型 属性 能 多 次 分 裂 一 标 
树 ,因此 有 两 种 途径 可 供 选择 :终止 路 径 的 进一步 延伸 或 终止 使 用 该 属性 来 创建 新 
的 结 点 。 

可 以 看 出 ,CART 算法 与 C4.5 算法 非常 相似 ,但 也 有 一 些 区 别 。 一 个 明显 的 
区 别 是 ,不 管 属性 是 分 类 的 还 是 数值 的 ,CART 总 是 执行 数据 的 二 元 分 裂 。 第 二 个 
区 别 是 ,CART 调用 检验 数据 以 帮助 修剪 并 由 此 泛 化 已 创建 的 二 又 树 ,而 C4.5 算 
法 仅 使 用 训练 数据 来 创建 最 后 的 树 结构 。 


13.2.6 决策 树 属性 的 选取 


在 将 算法 应 用 到 一 组 数据 之 前 ,应 该 先进 行 属性 选取 , 即 C4.5 算法 步骤 (2)。 
在 建立 决策 树 确定 已 建树 的 大 小 时 进行 属性 选择 。 其 中 一 个 主要 目标 是 使 得 树 的 
层次 和 结 点 数 最 小 ,从 而 使 数据 泛 化 最 大 化 。C4 .5 算法 使 用 信息 论 的 方法 帮助 选 
择 属性 。 其 基本 思想 是 ,对 于 树 中 的 任何 选择 点 ,C4.5 算法 选择 分 裂 数 据 的 属性 ， 
以 显示 信息 中 最 大 的 数量 的 增益 。 为 此 ,假设 有 个 可 能 的 结果 (类 )。 这 些 结果 
所 传送 的 信息 可 以 用 - logz(1/z) 二 进 制 位 来 度量 。 例 如 ,如 果 ?=4, 就 有 -logz 
(1L4)=2, 即 它 用 两 位 表示 四 个 可 能 的 结果 (00、.01、10 和 11)。 即 两 位 唯一 地 确定 
了 4 个 类 。 假 设 属性 A 被 选 为 下 一 个 数据 分 裂 。 分 裂 的 结果 导致 每 条 新 树枝 平 
均 有 两 个 类 。 因 此 ,每 条 树枝 平均 需要 一 log,(1 人 /2)=1 位 来 表示 两 个 可 能 的 结果 。 
因此 ,选择 属性 A 带 来 一 位 信息 增益 。 在 树 的 每 一 选择 点 上 ,C4.5 算法 根据 这 个 
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思想 为 所 有 可 用 的 属性 计算 增益 值 。 在 决策 树 建立 过 程 的 每 个 选择 点 上 ,增益 值 
最 大 的 属性 是 用 来 进一步 细 分 树 结构 而 选取 的 属性 。 

属性 的 信息 增益 计算 方法 如 下 : 

设 S 是 训练 样本 的 集合 ,其 中 每 个 样本 的 类 标号 都 是 已 知 的 。 假 定 有 m 个 
类 ,集合 S 中 类 别 Ci; 的 记录 个 数 是 * 个 ,i=1,…,m。 一 个 给 定 的 样本 分 类 所 需 
的 期 望 信息 是 


也 Ky Te 
E(A)= >， te 


j=1 


设 属性 A 具有 值 ia1,…,a,}。 属性 A 可 以 用 来 对 S 进行 分 组 ,将 S 分 为 子 
集 S1,…,S,, 其 中 Si 包含 S 中 值 为 aj 的 那些 样本 。 设 Si 包含 类 C; 的 5S; 个 样本 。 
根据 A 的 这 种 分 裂 的 期 望 信息 称 为 属性 A 的 业 ,为 


Si Si 
TO) 
i=1 “* 


A 的 信息 增益 为 
Gain(A) = I(s1,s2,° ,sm) — E(A) 

在 实际 应 用 中 , 先 计算 每 个 属性 的 信息 增益 ,然后 用 得 到 的 信息 增益 值 对 属性 
进行 排序 。 也 可 以 根据 需要 ,用 一 个 属性 选取 过 程 的 直观 方法 , 即 优 度 了 的 概念 
来 简化 属性 选择 的 复杂 计算 。 

处 理 数值 型 决策 树 问题 的 常用 方式 是 对 数据 值 进行 排序 并 考虑 每 对 值 之 间 的 
二 元 分 裂 , 然 后 为 每 个 可 能 的 分 烈 点 计算 优 度 值 。 这 样 ,每 个 分 裂 点 看 成 是 有 两 个 
值 的 分 裂 属 性 。 对 每 个 选择 点 进行 此 计算 , 找 出 优 度 值 最 大 的 分 裂 点 作为 最 好 的 
数据 分 裂 点 。 


13.2.7 改进 决策 树 性 能 的 方法 


作为 分 类 结果 的 决策 树 ,没有 必要 让 其 生长 得 太 “ 枝 繁 叶 茂 ”, 否则 , 既 降低 了 
树 的 可 理解 性 和 可 用 性 ,同时 也 使 决策 树 本 身 对 训练 集 数据 的 依赖 性 增 大 。 也 就 
是 说 ,这 棵 决策 树 对 此 训练 集 数 据 可 能 非常 准确 ,但 一 旦 应 用 到 新 的 数据 时 其 准确 
性 却 急剧 下 降 。 

为 了 使 决策 树 蕴含 的 规则 具有 普遍 意义 ,必须 防止 以 上 过 分 拟 合 现象 ,需要 使 
用 剪 枝 方法 ,解决 该 过 分 拟 合 问题 。 常 用 的 方法 有 两 种 :其 一 是 增加 限制 条 件 , 如 
限制 树 的 最 大 高 度 ( 层 数 ) 或 限制 每 个 结 点 所 含 数据 的 最 小 个 数 等 。 其 二 是 对 树 进 


@” 优 度 :用 准确 度 值 (定义 正确 分 类 的 样本 数 占 训练 集 样本 总 数 的 百分比 ) 除 以 分 支 总 数 ,定义 为 属性 
的 优 度 值 ,是 属性 概 化 能 力 的 一 个 度量 指标 。 


“256 * 地 理 信息 系统 算法 基础 





行 剪 枝 (pruning) ,一 般 用 统计 度量 来 去 掉 不 可 靠 的 分 枝 , 改 进 预报 能 力 和 分 类 速 
度 。 这 里 又 有 两 个 具体 措施 ,一 个 是 所 谓 先 剪 (prepruning) , 即 在 树 生长 前 通过 统 
计 度 量 对 分 裂 准 则 函数 做 出 评价 ,如 果 达 不 到 规定 的 要 求 就 先前 掉 该 分 枝 ; 再 一 个 
是 后 前 (postpruning) , 即 在 树 长 成 后 再 剪 枝 。 

同时 ,决策 树 的 可 伸缩 性 也 不 容 忽 视 。 决 策 树 的 可 伸缩 性 是 指 决策 分 类 效果 
不 随 分 类 样本 集 的 明显 扩大 或 缩小 而 产生 偏差 。 大 部 分 决策 树 算法 在 运行 时 都 要 
求全 部 训练 样本 数据 一 次 性 调 人 内 存 , 因 此 ,对 于 相对 小 的 数据 集 有 效 , 而 对 于 相 
对 大 的 数据 集 ,其 效果 明显 降低 。 为 了 保证 分 类 效果 ,需要 强调 算法 的 可 伸缩 性 。 
为 了 提高 决策 树 归纳 的 可 伸缩 性 ,人 们 提出 了 一 些 新 的 基于 决策 树 的 分 类 方法 ,如 
SLIQ、SPRIN、PUBLIC、RainForest 等 。 


13.3 泛 化 规则 算法 


概念 层次 结构 是 所 有 数据 挖掘 的 基础 ,而 面向 属性 的 方法 经 改进 和 扩充 后 可 
用 于 关系 数据 库 的 数据 挖掘 , 称 之 为 面向 属性 的 泛 化 方法 。 该 方法 把 机 器 学 习 , 特 
别 是 示例 学 习 技术 ,与 面向 集合 的 数据 库 操作 结合 起 来 ,大 大 提高 数据 挖掘 的 功能 
和 效率 。 这 种 方法 不 但 用 于 关系 数据 挖掘 ,而 且 可 用 于 髓 套 关 系数 据 库 和 演绎 数 
据 库 中 的 知识 发 现 。 面 向 属性 的 泛 化 方法 与 统计 方法 相 结合 ,还 可 以 对 含有 噪声 
的 数据 进行 数据 挖掘 。 


13.3.1 概念 层次 


概念 层次 是 表示 数据 挖掘 中 背景 知识 的 重要 手段 , 它 与 面向 属性 的 方法 相 结 
合 , 使 面向 属性 的 泛 化 方法 成 为 数据 挖掘 中 非常 有 用 的 技术 ,广泛 用 于 特征 规则 控 
据 、 多 层 知识 挖掘 、 分 类 和 预测 等 。 


1. 基本 概念 


概念 层次 结构 (concept hierarchy) 表 示 把 一 组 较 低 级 概念 映射 到 与 它们 相对 
应 的 较 高 级 概念 的 次 序 , 这 种 映射 可 以 按 偏 序 关 系 (A) 来 组 织 概念 集 。 偏 序 关 系 
反映 了 概念 之 间 的 特殊 一 一 般 关系 ,可 以 用 树 、 格 或 有 向 无 循环 图 等 来 表示 ,通称 
为 层次 结构 。 如 果 用 树 结 构 表 示 概 念 层次 , 则 树 结 构 的 所 有 术语 都 可 以 用 于 概念 
层次 。 

概念 层次 :概念 层次 8 是 一 个 偏 序 集 ( 互 ,A) ,其 中 ,日 是 概念 的 一 个 有 限 集 ， 
是 关于 互 的 一 个 偏 序 。 

正则 概念 层次 :概念 层次 @6= ( 互 ,A) 是 正则 的 ,如 果 五 中 有 一 个 最 大 元 素 (最 
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一 般 的 概念 ), 且 有 集合 HH;,k=0,1,…,(n 一 1), 则 
H=UH(kR=0,%…,n-1) HNH=® iz¥j) 
并 且 ,如果 瓦 中 某 个 概念 的 最 近 祖先 在 瓦 中 , 则 玉 中 其 他 概念 的 最 近 祖 先 
也 都 在 瓦 中 。 
如 果 不 特殊 说 明 ,一 般 都 是 指正 则 概念 层次 。 
概念 层次 中 自 上 而 下 的 层次 号 依次 为 0,1,…,&,…。 层 次 号 为 & 的 概念 称 为 
层 & 上 上 的 概念 。 具 有 相同 层次 号 的 概念 必定 在 集合 本 中 。 


2. 概念 层次 的 类 型 


概念 层次 的 类 型 有 四 种 :模式 层次 、 集 合 分 组 层次 .导出 操作 层次 和 基于 规则 
的 层次 。 


1) 模式 层次 

模式 层次 是 在 模式 级 上 通过 定义 反映 数据 库 属 性 之 间 联 系 的 偏 序 关系 而 形成 
的 。 如 ,门牌 号 码 A 街道 A 城市 A 省 份 A 国家 形成 模式 上 的 偏 序 关系 。 它 指明 ， 
沿 模式 自 左 向 右 是 泛 化 , 自 右 向 左 是 特 化 ,因而 ,毋须 为 每 个 数据 记录 指定 泛 化 或 
特 化 的 路 径 。 

对 数据 挖掘 任务 而 言 ,需要 把 模式 层次 泛 化 到 数据 库 的 有 关 数 据 上 ,从 而 得 到 
该 模式 的 具体 值 或 实例 层次 ,为 此 ,需要 同时 存放 模式 层 和 实例 层 上 的 偏 序 。 

2) 集合 分 组 层次 

这 种 概念 层次 是 通过 定义 一 组 概念 (或 属性 ) 值 的 子 集 之 间 的 关系 而 形成 的 ， 
反映 应 用 领域 的 语义 联系 特点 , 它 可 用 于 详细 说 明 模 式 层次 或 其 他 集合 分 组 层次 。 

3) 导出 操作 层次 

通过 定义 数据 上 的 一 组 操作 形成 导出 操作 层次 ,常用 于 描述 数字 型 属性 。 

4) 基于 规则 的 层次 结构 


以 上 三 种 概念 层次 的 特点 是 ,每 一 个 概念 只 有 一 个 较 高 层 的 概念 ,因此 可 以 把 
一 个 概念 无 条 件 地 泛 化 到 它 的 较 高 层 概念 。 然 而 有 时 候 ,一 个 概念 的 泛 化 还 涉及 


到 该 概念 以 外 的 其 他 条 件 。 
基于 规则 的 概念 层次 将 概念 层次 的 无 条 件 泛 化 扩展 到 有 条 件 的 泛 化 ,进一步 
完善 了 面向 属性 的 方法 。 


车 一 个 概念 层次 的 各 条 路 径 具 有 相应 的 泛 化 规则 , 则 称 之 为 基于 规则 的 概念 
层次 ,通常 用 格 结构 描述 。 一 般 来 说 , 它 有 三 种 类 型 。 
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第 一 种 ,概念 泛 化 与 演绎 规则 有 关 。 规 则 形式 为 
A(zr)AB(z)>C(z) 
式 中 ,z 为 元 组 ;A、B、C 为 概念 。 若 元 组 z 满足 条 件 B, 则 把 概念 A 提升 到 概念 
C。 条 件 B(z) 是 一 个 简单 谓词 ,或 一 个 包含 不 同属 性 和 关系 的 复杂 逻辑 公式 。 
第 二 种 ,概念 泛 化 与 计算 规则 有 关 。 计 算 规 则 表示 成 条 件 表达 式 , 其 值 可 从 元 
组 或 数据 库 中 计算 出 来 。 条 件 的 真 值 决定 一 个 概念 是 否 可 以 通过 某 路 径 泛 化 。 
第 三 种 ,混合 型 。 同 时 把 演绎 规则 与 计算 规则 结合 起 来 确定 泛 化 路 径 。 


3. 概念 层次 的 作用 


通常 ,可 以 在 不 同 的 概念 层次 上 对 数据 进行 抽象 。 数 据 库 中 的 原始 数据 是 最 
基础 的 概念 ,大 多 数 统计 分 析 都 是 根据 原始 数据 进行 的 ,其 学 习 结果 是 一 种 基础 知 
识 。 如 果 在 较 高 概念 层 上 对 原始 数据 进行 抽象 ,并 发 现 和 表示 知识 ,就 可 以 得 到 较 
高 级 的 知识 。 

概念 层次 可 用 于 各 种 挖掘 任务 ,可 把 原始 数据 泛 化 到 某 个 较 高 抽象 层 、 多 层 规 
则 挖掘 等 。 为 了 把 概念 层次 用 于 数据 挖掘 ,需要 解决 如 何 说 明 挖掘 任务 所 需要 的 
概念 层次 、 如 何 从 现 有 数据 集 自动 生成 概念 层次 ,如 何 存储 和 处 理 网 状 概 念 层次 结 
构 、 如 何 提高 概念 层次 结构 的 搜索 效率 等 关键 问题 。 


13.3.2 面向 属性 泛 化 的 策略 与 特点 
1. 面向 属性 泛 化 的 策略 


策略 1( 面 向 属性 泛 化 ) :属性 是 关系 的 原子 单位 , 泛 化 时 一 个 属性 一 个 属性 地 
进行 。 通 过 移 去 不 可 泛 化 的 属性 和 概念 树 提升 ,对 属性 进行 泛 化 。 

策略 2( 移 去 不 可 泛 化 的 属性 ): 若 属性 尽管 有 很 多 个 不 同 的 值 ,但 没有 更 一 般 
意义 上 的 高 层 概念 来 归纳 它 ( 即 没有 对 应 的 概念 树 ), 则 认为 该 属性 在 泛 化 过 程 中 
是 没有 意义 的 ,可 将 它 移 去 。 

策略 3( 概 念 树 提 升 ) :对 于 某 一 元 组 的 属性 值 , 若 概念 树 中 存在 一 个 更 高 层次 
的 概念 ,就 用 该 概念 替换 属性 值 ,从 而 把 该 元 组 泛 化 。 泛 化 时 每 次 提升 一 层 , 以 控 
制 泛 化 速度 ,避免 过 泛 化 。 

策略 4( 累 计 帮 盖 度 ) : 当 一 个 元 组 被 泛 化 时 ,应 将 该 元 组 的 覆盖 度 值 带 到 它 的 
泛 化 元 组 中 ; 当 合并 相同 元 组 或 去 掉 元 余 元 组 时 ,应 把 覆盖 度 累 计 起 来 。 

通过 概念 提升 ,逐步 将 数据 库 浓 缩 ,使 每 条 元 组 能 覆盖 原始 数据 库 中 的 多 个 元 
组 ,形成 所 谓 的 宏 元 组 。 由 宏 元 组 组 成 的 表 称 为 知识 基 表 ,或 简称 知识 基 。 经 过 概 
念 提升 后 ,原本 不 同 的 元 组 可 能 会 变 得 完全 一 样 , 这 就 要 去 掉 宛 余 元 组 ,并 根据 策 
略 5 判定 是 否 要 进一步 提升 。 
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策略 5( 指 定 泛 化 阐 值 控制 概念 提升 ): 用 户 指 定 的 泛 化 病 值 ,其 实 就 是 把 知 
识 基 表 进一步 浓缩 ,最 后 得 到 的 宏 元 组 的 最 大 数量 。 对 于 知识 基 表 中 的 某 个 属性 ， 
如 果 它 的 不 同 值 的 个 数 大 于 用 户 指定 的 泛 化 阔 值 ,就 要 把 这 个 属性 进一步 泛 化 。 

经 过 面向 属性 的 概念 树 提升 后 , 泛 化 关系 中 的 元 组 数量 仍然 可 能 大 于 用 户 指 
定 的 阐 值 ,这 时 需要 进一步 泛 化 ,为 此 有 策略 6。 

策略 6( 指 定 阔 值 、 控 制 已 泛 化 关系 ) :如 果 已 泛 化 关系 的 元 组 数 仍 大 于 用 户 指 
定 的 泛 化 阔 值 , 则 应 对 该 关系 继续 泛 化 。 

对 已 泛 化 关系 的 进一步 泛 化 ,并 合并 相同 元 组 ,可 大 大 减 小 已 泛 化 关系 的 规 
模 。 选 择 被 泛 化 属性 有 多 种 原则 ,如 侧重 于 减少 元 组 数目 或 不 同属 性 值 的 数目 、 侧 
重 于 简化 最 终 学 习 到 的 规则 等 。 最 后 的 泛 化 关系 只 包含 很 少 的 几 个 元 组 ,再 利用 
策略 7 把 它 转化 成 一 个 简单 的 逻辑 公式 。 

策略 7( 规 则 转换 ) :将 泛 化 关系 中 的 一 个 宏 元 组 转换 成 一 条 合 取 规则 ,多 个 宏 
元 组 可 以 转换 成 多 条 规则 的 析 取 。 


2. 面向 属性 泛 化 的 特点 


传统 的 机 器 学 习 算法 大 部 分 是 面向 元 组 的 , 当面 向 元 组 的 方法 用 于 大 型 数据 
库 时 ,效率 非常 低 。 主 要 是 因为 这 些 算法 没有 充分 利用 数据 库 系统 的 特长 和 实现 
技术 。 面 向 属性 的 泛 化 方法 提供 了 一 个 在 关系 数据 库 中 学 习 不 同 规则 的 简单 而 有 
效 的 方法 。 与 面向 元 组 方法 相 比 , 它 有 下 列 优点 。 

(1) 面向 属性 。 虽 然 面向 元 组 和 面向 属性 这 两 种 泛 化 方法 都 把 属性 排除 和 概 
念 树 提升 作为 主要 的 泛 化 技术 ,然而 两 种 方法 的 搜索 空间 明显 不 同 。 在 面向 属性 
方法 中 ,每 一 个 属性 的 概念 层次 都 可 以 看 作 被 分 解 了 的 搜索 空间 ,这 就 大 大 提高 了 
计算 效率 。 

(2) 学 习 效 率 高 。 面 向 属性 方法 在 泛 化 过 程 中 使 用 了 诸如 选择 、 连 接 、 投 影 、 
元 组 替换 (概念 树 提升 )、 交 运算 (发 现 类 之 间 的 公共 元 组 ) 等 操作 。 关 系数 据 库 的 
SQL 操作 是 面向 集合 的 ,因此 不 仅 效率 高 ,而且 容 易 与 现 有 关系 系统 的 无 缝 集 成。 

(3) 功能 强 。 面 向 属性 的 泛 化 方法 综合 了 许多 先进 学 习 算法 的 优点 ,不 仅 可 
以 学 习 析 取 规则 ,而 且 还 可 以 通过 统计 技术 处 理 异常 情况 。 此 外 , 当 数 据 库 插入 一 
个 新 元 组 时 ,面向 属性 的 泛 化 方法 不 是 从 头 开始 学 习 ,而 是 根据 以 前 学 习 到 的 知识 
变更 和 加 强 学 习 点 , 即 面向 属性 归纳 方法 很 容易 扩充 , 臂 如 可 改进 为 增 量 式 学 习 。 
假定 概念 层次 是 平衡 树 ,初始 概念 都 在 叶 结 点 上 。 这 样 , 泛 化 可 以 在 每 个 属性 上 并 
行进 行 。 如 果 稍 微 修改 基本 归纳 算法 ,也 可 以 在 非 平衡 概念 树 的 不 同 层次 上 进行 
泛 化 。 
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13.3.3 基于 规则 的 面向 属性 泛 化 方法 
1. 面向 属性 泛 化 的 基本 算法 


输入 :中 关系 数据 库 ;@ 概 念 层 次 ;加 学 习 结 果 的 表达 形式 (如 泛 化 闭 值 
threshold) 。 
输出 :特征 规则 。 
基本 步骤 :中 汇集 与 任务 相关 的 数据 ;@@ 执 行 基本 的 面向 属性 的 泛 化 ;@@ 简 化 
泛 化 关系 ;@ 则 把 最 后 的 关系 转化 成 为 逻辑 规则 。 其 中 ,第 @ 步 的 算法 描述 如 下 : 
begin / 基本 的 面向 属性 的 泛 化 
for 泛 化 关系 GR 中 的 每 一 个 属性 Al, (1 委 委 n,n 为 属性 个 数 ) do 
while Ai 中 不 同 值 的 个 数 大 于 泛 化 阔 值 do | 
if Ai 的 概念 层次 表 中 没有 更 高 层 的 概念 
then 移 去 Ai 
else 用 较 高 层 概念 替换 Ai 的 值 ;合并 相同 元 组 ， 


end 
2. 基于 规则 的 面向 属性 泛 化 方法 


采用 基于 规则 的 概念 层次 可 以 有 效 地 提高 面向 属性 泛 化 的 表示 和 归纳 能 力 。 
下 面 结合 基于 演绎 规则 的 概念 层次 ,分 析 基 于 规则 的 面向 属性 泛 化 方法 。 为 基于 
规则 的 面向 属性 泛 化 方法 定义 一 个 七 元 组 :(EDB, RCH, DS, TS, KRS, ATh， 
RTh)。 其 中 ,EDB 是 扩充 的 关系 数据 库 ;RCH 是 一 组 基于 演绎 规则 的 概念 层次 ， 
每 个 属性 都 有 一 个 RCH;DS 是 支持 概念 泛 化 的 一 个 演绎 系统 ,包括 RCH 中 的 所 
有 演绎 规则 和 一 组 支撑 规则 ;TS 是 一 组 任务 规格 说 明 ;KRS 是 用 一 阶 谓词 表示 的 
知识 模式 ;ATh 和 RTh 分 别 是 期 望 的 属性 冰 值 和 元 组 阔 值 (控制 过 泛 化 )。 

归纳 的 目标 是 从 数据 库 EDB 中 提取 满足 任务 说 明 TS 的 一 般 知识 ,在 演绎 系 
统 DS 支持 下 , 沿 概 念 层次 RCH 提供 的 方向 进行 泛 化 ,学 习 结 果 由 知识 模式 KRS 
定义 的 模式 表示 。 


1) 基于 规则 的 面向 属性 泛 化 过 程 


基于 规则 的 面向 属性 泛 化 过 程 分 为 两 个 阶段 : 

第 一 阶段 :使 用 两 遍 扫 描 算法 ,把 初始 关系 泛 化 到 主 关系 (prime relation)。 

第 一 遍 扫描 :使 用 演绎 系统 DS 找 出 每 个 属性 A 的 最 小 的 期 望 层次 。 当 第 一 
次 扫描 初始 关系 时 ,对 于 每 个 属性 A ,演绎 系统 将 从 概念 层次 最 底层 开始 向 上 , 计 
算 每 一 层 上 初始 关系 中 的 基本 事实 有 多 少 个 不 同 值 可 以 被 泛 化 。 最 小 的 期 望 层次 


第 13 章 空间 数据 挖 握 算 法 . 261 . 





LA 就 是 初始 关系 中 能 被 泛 化 的 不 同 值 的 个 数 小 于 阔 值 ATh 的 层次 。 

第 二 遍 扫 描 :元 组 泛 化 和 合并 。 再 次 扫描 初始 关系 ,DS 将 它 的 每 个 元 组 及 其 
属性 泛 化 到 LA 层 。 同 时 ,比较 泛 化 后 的 元 组 ,合并 相同 元 组 ,最 后 得 到 主 关 系 。 

第 二 阶段 :从 主 关系 到 结果 关系 。 

选择 几 个 属性 继续 泛 化 ,重复 “ 泛 化 一 比较 一 合并 ”过 程 ,直到 关系 的 规模 小 于 
ATh 和 RTh( 也 可 以 在 泛 化 前 移 去 某 些 属性 )。 


2) 丢失 信息 的 处 理 


在 把 主 关系 归 约 到 结果 关系 时 ,信息 丢失 问题 是 非常 重要 的 。 在 基本 的 面向 
属性 泛 化 中 ,总 是 通过 概念 树 提升 对 基本 关系 的 属性 作 进一步 泛 化 ,这 是 因为 泛 化 
的 唯一 基础 是 当前 被 泛 化 的 属性 值 。 然 而 ,基于 规则 的 泛 化 则 不 同 ,因为 某 一 规则 
的 应 用 所 依赖 的 信息 可 能 是 初始 关系 中 有 ,而 主 关系 中 所 没有 的 信息 。 这 些 被 丢 
失 的 信息 在 下 列 情形 下 可 能 是 至 关 重 要 的 :规则 可 能 依赖 于 已 被 移 去 的 属性 ;规则 
可 能 依赖 于 某 个 属性 ,该 属性 在 主 关系 中 的 概念 层次 上 被 泛 化 得 太 高 ,无 法 与 规则 
条 件 相 匹配 ;规则 可 能 依赖 于 一 个 只 能 相对 于 初始 关系 求 值 的 条 件 。 

为 解决 信息 丢失 问题 ,提出 了 回溯 算法 。 一 个 泛 化 元 组 是 初始 关系 中 一 组 元 
组 的 合并 , 称 这 一 组 元 组 为 泛 化 元 组 的 源 集 ;而 把 泛 化 元 组 称 为 源 集 的 覆盖 。 回 济 
算法 的 基本 原理 如 下 : 

(1) 把 基本 关系 中 的 覆盖 元 组 退回 到 它们 的 源 集 。 实 现 方 法 是 ,在 初始 关系 
中 增加 一 个 虚拟 属性 Covering-tuple-id( 履 盖 - 元 组 -标识 ) ,记录 与 源 集中 元 组 相对 
应 的 覆盖 元 组 的 身份 。 

(2) 选择 几 个 属性 ,进一步 将 它们 泛 化 到 更 高 的 层次 。 与 面向 属性 的 基本 泛 
化 算法 不 同 的 是 ,这 一 泛 化 必须 由 演绎 系统 DS 根据 初始 关系 而 不 是 主 关系 完成 。 

(3) 比较 且 合 并 泛 化 后 的 元 组 。 比 较 是 在 具有 相同 Covering-tuple-id 的 元 组 
中 进行 的 ,并 且 只 与 被 选 作 进一步 泛 化 的 属性 有 关 , 结 果 产 生 一 个 增强 型 主 关 系 。 

(4) 把 合并 过 的 元 组 往 回 映 射 到 主 关 系 , 并 在 主 关系 中 将 元 组 分 解 。 把 增强 
型 主 关 系 中 具有 相同 Covering-tuple-id 的 所 有 元 组 ,映射 到 与 之 相对 应 的 主 关系 的 
覆盖 元 组 中 。 然 后 按照 这 种 映射 把 主 关系 中 的 元 组 分 成 几 个 元 组 ,并 调整 覆盖 度 。 
最 后 ,根据 所 选择 的 属性 ,将 分 开 的 元 组 泛 化 到 增强 型 主 关 系 中 的 相应 值 。 

(5) 在 分 解 后 的 基本 关系 中 合并 泛 化 元 组 。 如 果 合 并 元 组 后 的 关系 的 规模 仍 
大 于 泛 化 阐 值 , 则 重复 汉化 过 程 ,直到 泛 化 后 关系 的 规模 在 阐 值 之 内 。 


3. 基于 规则 的 面向 属性 的 泛 化 算法 


输入 :学 习 任 务 的 规格 说 明 Ts,R 是 初始 关系 。 
输出 :结果 关系 Rf。 
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步 又: 

第 一 阶段 :从 初始 关系 R 中 泛 化 出 基本 关系 : 

由 Ri=R, 其 中 R, 是 一 个 临时 的 关系 。 

@@ 对 于 R, 的 每 个 属性 A;, 计 算 它 的 最 小 期 望 层次 Li。 

@@ 对 于 R, 中 的 每 一 个 元 组 和 属性 ,推出 它 在 层次 Li 上 的 泛 化 值 ,并 用 推出 的 
值 替 换 Ai。 

原来 的 值 ;合并 相同 元 组 ,并 且 把 被 合并 元 组 的 个 数 作为 覆盖 度 记录 下 来 ;在 
初始 关系 R 中 增加 虚拟 属性 Covering-tuple-id, 存 放 R, 中 相应 覆盖 元 组 的 标识 。 

@ 主 关系 R,=R。 

第 二 阶段 :通过 回溯 从 R, 中 泛 化 出 结果 关系 Ri。 假 设 关系 R, 中 有 N 个 元 
组 , 则 

while N> 元 组 阔 值 RTh do 

begin 

@ 从 主 关系 Ru 中 选择 一 组 属性 A(1 科 j 科 kk<N) 作 进一步 泛 化 ;同时 确定 
每 一 个 属性 

Ai 的 期 望 层次 L; 

人 临时 关系 Ri= Ri 

@ 对 于 Ri 中 的 每 一 个 元 组 和 选 出 来 的 每 一 个 属性 Ai ,推出 它 在 层次 Li 上 的 
泛 化 值 。 

根据 所 选择 的 属性 以 及 它们 的 Covering-tuple-id 值 比较 R, 中 的 元 组 ;又 根据 
选 出 来 的 属性 以 及 它们 的 Covedne-tuple-id 值 ,对 相同 元 组 进行 合并 和 投影 ,结果 
存放 在 临时 关系 Ro 中 (增强 的 基本 关系 ); 

@ 分 烈 关系 R=R,; 

加 将 Rw 中 的 元 组 t 分 裂 为 与 Ro 中 的 元 组 相对 应 的 一 组 元 组 ,这 些 元 组 的 
Covering-tuple-id 与 元 组 t 的 标识 相等 。 在 分 裂 后 的 Re 中 合并 相同 元 组 ; 

@@ 主 关 系 Re = Ry; 

endo 

结果 关系 Rr= Rpo . 

以 上 算法 的 复杂 度 可 以 分 解 为 泛 化 成 本 和 演绎 成 本 。 算 法 的 泛 化 部 分 是 高 效 
的 ,而 演绎 部 分 的 成 本 则 取决 于 规则 的 复杂 性 和 演绎 系统 DS 的 效率 。 算 法 中 的 
演绎 规则 是 与 概念 图 有 关 的 条 件 规则 ,在 大 多 数 情 况 下 这 些 条 件 规则 是 简单 的 。 
因此 ,实际 上 可 以 认为 每 个 演绎 过 程 都 由 该 算法 分 析 中 的 某 个 常量 界定 。 所 以 ,如 
果 把 一 个 属性 泛 化 到 任 一 个 层次 的 成 本 是 有 限 的 , 则 基于 规则 的 面向 属性 的 泛 化 
算法 的 复杂 度 是 O(logs N) ,其 中 N 是 初始 数据 关系 中 元 组 的 个 数 。 
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13.4 相关 分 析 


相关 关系 是 指 事物 之 间 的 关系 数值 存在 着 一 定 的 依存 关系 , 即 某 一 现象 在 其 
发 展 变化 中 , 当 数 量 上 为 一 确定 值 时 ,与 之 有 联系 的 其 他 现象 可 以 有 若干 个 数值 与 
之 对 应 ,但 这 些 值 按 某 种 规律 在 一 定 范围 内 进行 波动 。 相 关 关 系 的 特点 是 :一 个 变 
量 的 取 值 不 能 由 另 一 个 变量 唯一 确定 ,也 不 能 用 函数 形式 予以 描述 ,但 并 不 是 无 规 
律 可 循 。 

相关 关系 的 分 类 :中 根 据 相 关 关 系 涉 及 变量 的 多 少 , 可 分 为 单 相关 和 复 相关 。 
两 个 变量 之 间 的 相关 为 单 相关 ;三 个 或 三 个 以 上 变量 之 间 的 相关 为 复 相 关 。 单 相 
关 是 复 相 关 的 基础 。@ 从 相关 关系 表现 形态 的 不 同 ,可 分 为 直线 相关 和 曲线 相关 。 
如 果 两 个 变量 之 间 相互 变化 近似 为 一 条 直线 , 则 称 为 直线 相关 ;如 果 变 量 之 间 的 相 
互 变化 近似 为 一 条 曲线 , 则 称 为 非 线性 相关 或 曲线 相关 。@ 根 据 相 关 关 系 的 变化 
方向 ,可 分 为 正 相 关 、 负 相关 以 及 无 相关 (或 零 相 关 )。 若 两 个 变量 同方 向 变化 , 称 
为 正 相 关 ; 若 两 个 变量 反方 向 变化 , 则 称 为 负 相 关 ; 若 两 个 量 的 变化 互 不 影响 , 则 称 
为 无 相关 (或 零 相 关 )。 

地 理 要 素 之 间 相 互 关系 的 密切 程度 通常 用 相关 系数 来 描述 , 即 相关 系数 是 在 
直线 相关 条 件 下 ,两 个 现象 之 间 相 关 关 系 密切 程度 的 统计 分 析 指 标 。 若 相关 系数 
是 根据 总 体 数据 计算 的 , 称 为 总 体 相关 系数 ;若是 根据 样本 数据 计算 的 , 则 称 为 样 
本 相关 系数 ,本 节 中 的 相关 系数 指 后 者 。 相 关 分 析 的 内 容 很 多 ,这 里 只 介绍 直线 相 
关 分 析 的 基本 内 容 。 


13.4.1 两 要 素 间 的 相关 分 析 
1. 相关 关系 的 判断 


计算 相关 系数 之 前 ,首先 要 判定 两 个 现象 之 间 是 否 存在 着 直线 相关 ,否则 计算 
出 的 相关 系数 就 没有 实际 意义 。 判 定 的 一 般 方法 是 作 图 法 和 假设 检验 法 。 作 图 法 
是 通过 作 散 点 图 来 判定 两 个 现象 之 间 是 否 存 在 直线 相关 。 假 设 检验 法 是 运用 假设 
检验 的 理论 对 相关 系数 进行 检验 而 做 出 判定 。 

散 点 图 的 绘制 是 在 直角 坐标 中 用 横 坐 标 代 表 自 变量 , 纵 坐 标 代 表 因 变量 ,每 组 
数据 (z,y) 在 坐标 系 中 用 一 个 点 表示 , 几 组 数据 在 坐标 系 中 形成 的 点 称 为 散 点 ,这 
种 图 像 称 为 散 点 图 。 散 点 图 直观 地 描述 了 两 个 变量 的 大 致 关 系 ,图 中 可 以 直观 地 
看 出 两 个 变量 之 间 有 无 相关 关系 及 相关 的 形态 ,方向 和 密切 程度 。 但 散 点 图 不 能 
准确 反映 变量 之 间 的 关系 密切 程度 ,因此 ,为 准确 度量 两 个 变量 之 间 的 关系 密切 程 
度 , 需 要 计算 相关 系数 。 
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2. 简单 相关 系数 的 计算 


两 个 变量 之 间 线 性 相关 程度 的 度量 称 为 简单 相关 系数 (或 称 为 单 相关 系数 )。 
对 于 两 个 要 素 之 与 y ,如 果 它 们 的 样本 值 分 别 为 Ti Yi (1 a 1 ;2 "Nn ) 9 则 它们 之 
闻 的 相关 系数 (rz ) 定 义 为 


> — ZT)(y; — 3) 
1 一 互 ) /D0 — 5) 


式 中 , 志 = 二 了 = ge ,分 别 为 两 个 要 素 样本 值 的 平均 值 。 


rwy 介 于 一 1 和 1 之 间 , 若 人 则 表示 正 相关 , 即 两 要 素 同 向 发 展 ; 若 rw < 
0, 则 表示 负 相 关 , 即 两 要 素 异 向 发 展 。r。, 的 绝对 值 越 接近 1 ,表示 两 要 素 的 关系 越 
密切 ; ,的 绝对 值 越 接近 0 ,表示 两 要 素 的 关系 越 不 密切 。 用 相关 系数 表示 的 相关 
程度 的 等 级 有 如 下 几 种 情形 。 

(1) r=0: 表 示 不 相关 ; 

(2) |r|<0.3: 表 示 极 低 度 相关 ; 

(3) 0.3 委 |r|<0.5: 表 示 低 度 相 关 ; 

(4) 0.$ 委 |r|<0.8: 表 示 中 度 相 关 ; 

(5) |7| 宇 0.8: 表 示 高 度 相关 ; 

(6) 1>r| =1: 表 示 完 全 相关 。 

应 注意 的 是 , 当 要 素 之 间 的 非 线性 相关 程度 较 大 时 可 能 导致 + = 0, 此 时 应 结 
合 散 点 图 做 出 合理 解释 ,而 不 宜 推论 出 两 个 要 素 无 关 的 结论 。 

如 果 记 : 


(13.1) 





则 公式 (13.1) 可 简化 为 
Ls, 
ps 
如 果 涉 及 到 n 个 要 素 ,同样 可 以 根据 公式 (13.1) 或 公式 (13.2) 计 算 任意 两 个 
要 素 之 间 的 相关 系数 ,这 样 就 可 以 得 到 多 要 素 的 相关 系数 矩阵 ; 





(13.2) 
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rll 712 ”站 

721 722 ”72n 
R= 

Tnl Tn2 Tnn 


显然 ,该 矩 阵 满 足 :@ri;=1(i=1,2,…,n);@rjy=ri(i,j = 1,2,…,n)。 
3. 简单 相关 系数 的 检验 


简单 相关 系数 随 样 本 数 的 多 少 或 取样 方式 的 不 同 而 不 同 ,因此 必须 通过 检验 ， 
才能 知道 它 的 可 信和 度 。 

当 |x|>>x, 即 所 计算 的 相关 系数 1x | 大 于 给 定 置信 水 平 a 下 的 临界 值 x。 时 
(通过 查 相关 系数 检验 的 临界 值 表 获 得 ) , 则 认为 两 要 素 相 关 , 此 时 两 要 素 不 相关 的 
可 能 性 只 有 a; 反 之 , 当 |r|<r。 时 ,认为 在 给 定 置信 水 平 a 下 ,两 要 素 不 相关 ,此 
时 的 样本 相关 系数 则 不 能 反映 两 要 素 之 间 的 关系 。 


13.4.2 多 要 素 之 间 的 相关 分 析 


在 多 要 素 所 构成 的 地 理 系 统 中 , 当 研 究 某 一 个 要 素 对 另 一 个 要 素 的 影响 或 相 
关 程 度 时 , 暂 不 考虑 其 他 要 素 的 影响 ,而 单独 研究 那 两 个 要 素 之 间 的 相互 关系 的 密 
切 程度 时 , 则 称 为 偏 相 关 。 用 来 度量 偏 相关 程度 的 统计 量 称 为 偏 相 关系 数 。 


1. 偏 相关 系数 的 计算 与 检验 


可 利用 单 相 关系 数 来 计算 偏 相关 系数 。 假 设 有 3 个 要 素 , 其 两 两 之 间 的 单 相 
关系 数 为 ry(i,j=1,2,3), 在 偏 相关 分 析 中 , 常 称 这 些 单 相关 系数 为 零 级 相关 系 
数 。 3 个 要 素 之 间 的 偏 相关 系数 共有 3 个， 即 r12.3\r13.2\7r23.1( 下 标点 后 面 的 数字 
代表 在 计算 偏 相关 系数 时 ,保持 不 变 的 量 ) ,其 计算 公式 分 别 如 下 


eh 713 712723 


人 Vv (1— ri3) (1 — 733) I V (1 -rh)(1- 7s) 








723 712713 
723:1 二 
V (1 -rh)(l- rt) 
上 述 3 个 偏 相关 系数 称 为 一 级 偏 相 关系 数 。 
若 有 4 个 要 素 , 则 有 6 个 偏 相关 系数 , 即 ~12.34，r13.24，r14.23，r23.14，724.13， 
r34.2 它们 称 为 二 级 偏 相关 系数 ,计算 公式 如 下 


712.3 7T14:3724:3 1713.2 714:2734.2 
7 六 13.24 一 


V (1— .31=-r33) V (1— rt) (1— r$.2) 











六 12.34 一 
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5 714.2 “713.2743.2 723.1 724.1734.1 
14-23 一 723:14 一 
V (1-— rf.2) (1- 79.2) V (1— rr) (1 -7.1) 
1 724:1 723:1743:1 本 734.1 732:1742:1 
24.13 一 34.12 一 
V (1— rg) (1— rh.1) V (171) (1— rh) 
车 所 考虑 的 要 素 多 于 4 个 时 , 则 可 以 依次 考虑 ,计算 三 级 甚至 更 多 级 偏 相关 
系数 。 
偏 相 关系 数 具 有 以 下 性 质 : 


(1) 偏 相 关系 数 分 布 的 范围 在 -1~1 之 间 。 
(2) 偏 相关 系数 的 绝对 值 越 大 ,表示 其 偏 相 关 程度 越 大 。 
(3) 偏 相 关系 数 的 绝对 值 必 小 于 或 等 于 由 同一 系列 资料 所 求 得 的 复 相关 





系数 。 
偏 相关 系数 的 显著 性 检验 ,一般 采 用 上 检验 法 。 其 计算 公式 为 
ES pe (13.3) 
~V | Ws 7 和 .34 


式 中 ,ri2.34…m 为 偏 相 关系 数 ;n 为 样本 数 ;mm 为 自 变 量 个 数 。 查 : 分 布 表 ,可 得 出 
不 同 显著 水 平 上 的 临界 值 i , 若 :> 则 表示 偏 相 关 显著 ;反之 ,t+< ts 则 表示 偏 相 
关 不 显著 。 


2. 复 相 关系 数 的 计算 与 检验 


实际 上 一 个 要 素 的 变化 往往 受到 多 种 要 素 的 综合 作用 和 影响 ,而 单 相关 和 偏 
相关 分 析 的 方法 都 不 能 反映 各 要 素 的 综合 影响 。 要 解决 这 一 问题 ,就 必须 采用 研 
究 几 个 要 素 同 时 与 某 一 个 要 素 之 间 的 相关 关系 的 复 相关 分 析 法 ,用 复 相关 系数 来 
测定 这 种 关系 。 

复 相 关系 数 可 以 利用 单 相 关系 数 和 偏 相 关系 数 求 得 。 设 Y 为 因 变 量 , Xi， 
X2,… ,Xz 为 自 变量 , 则 将 Y 与 自 变量 之 间 的 复 相 关系 数 记 为 RR,.12.…4 ,其 计算 公 
式 如 下 





RD = VL r) 72 [lo rsCD] (13.4) 

复 相关 系数 介 于 0 一 1 之 间 ,其 值 越 大 表明 要 素 之 间 的 相关 程度 越 密 切 , 且 必 
大 于 等 于 单 相关 系数 的 绝对 值 。 

复 相 关系 数 的 显著 性 检验 一 般 采 用 下 检验 法 ,其 计算 公式 为 

R12..8 1 一 R 一 工 
= x 

1 — R2.12...4 k 

式 中 ,n 为 样本 数 ;k 为 自 变 量 个 数 。 查 下 检验 的 临界 值 表 , 可 以 得 出 不 同 显 著 水 
平 上 的 临界 值 Ff。 车 下 > F, , 则 表示 复 相关 在 置信 和 度 水 平 a 上 显著 ;反之 , 则 认为 





F (13.5) 
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在 该 水 平 上 不 显著 , 即 因 变 量 Y 与 & 个 自 变 量 之 间 的 关系 不 密切 。 


13.4.3 关联 规则 算法 
1. 关联 规则 的 概念 


关联 可 分 为 简单 关联 时序 关联 及 因果 关联 等 。 关 联 分 析 的 目的 是 找 出 数据 
库 中 隐藏 的 关联 。 

关联 规则 是 描述 数据 库 中 数据 项 之 间 存 在 的 潜在 关系 规则 ,形式 为 “A, 人 A 
AAsA\…AA,a>BiA BoA…AB”, 其 中 Ai(i=1,2,…,m),B(j=1,2,.…,n) 
是 数据 库 中 的 数据 项 之 闻 的 关联 , 即 根据 一 个 事务 中 某 些 项 的 出 现 ,可 推导 出 另 一 
些 项 在 同一 事务 中 也 出 现 。 

数据 项 集 [= (i1,i2，,…,i) 是 由 m 个 不 同 标识 符 组 成 的 集合 。 每 个 (1 声 
k 声 1) 也 称 为 数据 项 集 (itemset) ,其 元 素 个 数 称 为 数据 项 集 的 长 度 , 长 度 为 & 的 
数据 项 集 称 为 上 维 数据 项 集 ( -itemset)。 

假设 事务 中 的 数据 项 按 字典 顺序 排列 ,& 维 数据 项 集 C 表示 为 C{1],C[2]， 
C[3],…,C[A]; 事 务工 是 IT 的 一 个 子 集 , 即 TEST ,每 个 事务 有 唯一 的 标志 TID， 
D 为 全 体 事物 集 ,对 数据 项 集 X71, 称 XCT, 当 且 仅 当 XT。 

关联 规则 具有 以 下 形式 X-~>Y, 其 中 XCT,YSET, 且 X 站 YY=5,X 称 为 规则 
的 先决 条 件 , Y 称 为 规则 的 结果 。 


2. 关联 规则 的 分 类 


从 不 同 的 角度 考察 ,关联 规则 有 多 种 分 类 方法 : 

(1) 根据 规则 中 处 理 的 值 类 型 ,关联 规则 可 以 分 为 布尔 型 和 数值 型 。 布 尔 型 
关联 规则 处 理 的 值 都 是 离散 的 、 种 类 化 的 , 它 显 示 了 不 同属 性 之 间 的 关系 ;而 数值 
型 关联 规则 可 以 和 多 维 关联 或 多 层 关联 规则 结合 起 来 ,对 数值 型 字段 进行 处 理 ,将 
它 动态 地 划分 成 不 同 的 区 间 ,或 者 直接 对 原始 的 数据 进行 处 理 ,或 者 在 规则 中 涉及 
除数 值 型 数据 之 外 的 其 他 类 型 的 数据 。 

(2) 根据 规则 中 数据 的 抽象 层次 ,可 以 分 为 单 层 关联 规则 和 多 层 关联 规则 。 
在 单 层 关 联 规则 中 ,没有 考虑 项 或 属性 的 现实 数据 所 具有 的 层次 性 ;而 在 多 层 关联 
规则 中 , 则 充分 考虑 了 项 或 属性 的 层次 性 。 

(3) 根据 规则 中 涉及 到 的 数据 的 维 数 ,关联 规则 可 以 分 为 单 维 的 和 多 维 的 。 
单 维 的 关联 规则 只 涉及 数据 的 一 个 维 , 多 维 的 关联 规则 要 处 理 的 数据 涉及 多 个 维 。 

(4) 根据 关联 规则 的 各 种 扩展 ,可 分 为 相关 分 析 、 最 大 模式 和 频繁 项 集 、 添 加 
约束 等 类 型 。 关 联 并 不 一 定 意味 着 相关 或 因果 ,有 时 需要 识别 不 同 项 之 间 是 否 相 
关 , 是 否 存 在 因果 关系 。 
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3. 关联 规则 的 度量 


一 般 可 以 采用 四 个 参数 来 描述 一 个 关联 规则 的 属性 。 

(1) 置信 和 度 (confidence) :规则 X 一 Y 在 数据 集中 的 置信 度 是 指 包 含 X 和 了 
的 数据 组 数 与 包含 X 的 数据 组 数 之 比 , 记 为 confidence(X-Y), 即 confidence(X 
一 Y)=|1IT:XUYET,TEDIMNHT:XSET,TEDII。 置 信和 度 表 示 规 则 的 强 
度 ,是 对 关联 规则 的 准确 度 的 衡量 。 

(2) 支持 度 (support) :规则 X 一 Y 在 数据 集 D 中 的 支持 度 是 数据 集中 包含 和 
和 YY 的 数据 组 数 与 所 有 数据 组 数 之 比 , 记 为 support(X->Y), 即 support(X 一 YY) 
=|1T:XUYCT,TEDI|AD1。 支持 度 表示 规则 的 频 度 ,是 对 关联 规则 重要 
性 (或 适用 范围 ) 的 衡量 。 

支持 度 说 明了 这 条 规则 在 所 有 事务 中 有 多 大 的 代表 性 ,显然 支持 度 越 大 ,关联 
规则 越 重 要 ,应 用 越 广 泛 。 有 些 关 联 规则 置信 和 度 虽 然 很 高 ,但 支持 度 很 低 , 说 明 该 
关联 规则 实用 的 机 会 很 小 ,因此 也 不 重要 。 

最 小 置信 和 度 阔 值 minconf 表示 规则 的 最 低 可 靠 性 ， 最 小 支持 度 国 值 minsup 表 
示 数 据 项 集 在 统计 意义 上 的 最 低 重 要 性 。 如 果 数 据 项 集 X 的 支持 度 Xsup 之 
minsup, 则 X 是 大 数据 项 集 (Large Itemset)。 置 信和 度 和 支持 度 大 于 相应 阔 值 的 规 
则 称 为 强 关联 规则 ,反之 , 称 为 弱 关 联 规 则 。 关 联 规则 挖掘 即 找 出 数据 库 的 强 关联 
规则 。 对 关联 规则 可 以 施加 语义 约束 ,例如 ,限制 规则 头 必须 包含 I ,或 规则 尾 必 
须 包 含 由 ,从 而 找到 感 兴趣 的 规则 。 

(3) 期 望 置信 和 度 (expected confidence): 设 DD 中 有 e% 的 事务 支持 数据 项 集 Y， 
e% 称 为 关联 规则 X 一 Y 的 期 望 置 信 度 。 期 望 置 信 度 描述 了 在 没有 任何 条 件 影 响 
时 ,数据 项 集 Y 在 所 有 事务 中 出 现 的 概率 有 多 大 。 

(4) 作用 度 (lift) :作用 度 是 置信 度 与 期 望 置信 和 度 的 比值 。 作 用 度 描述 数据 项 
集 X 的 出 现 对 数据 项 集 Y 的 出 现 有 多 大 的 影响 。 因 为 数据 项 集 Y 在 所 有 事务 中 
出 现 的 概率 是 期 望 置信 度 ; 而 数据 项 集 Y 在 有 数据 项 集 X 出 现 的 事务 中 出 现 的 概 
率 是 置信 度 ,通过 置信 度 对 期 望 置 信和 度 的 比值 反映 了 在 加 入 “数据 项 集 X 出 现 ” 的 
这 个 条 件 后 ,数据 项 集 Y 的 出 现 概 率 发 生 了 多 大 的 变化 。 

用 P(X) 表 示 事 务 中 出 现 数据 项 集 X 的 概率 , P(Y|X) 表 示 在 出 现 数 据 项 集 
X 的 事务 中 , 出 现 数据 项 集 Y 的 概率 , 则 以 上 四 个 参数 可 用 公式 表示 , 见 表 13.1。 

期 望 置 信和 度 描 述 了 在 没有 数据 项 集 X 的 作用 下 ,数据 项 集 Y 本 身 的 支持 度 ; 
作用 度 描述 了 数据 项 集 X 对 数据 项 集 Y 的 影响 力 的 大 小 。 作 用 度 越 大 ,说 明 数 据 
项 集 Y 受 数 据 项 集 X 的 影响 越 大 。 一 般 情况 ,有 用 的 关联 规则 的 作用 度 都 应 该 大 

1, 只 有 关联 规则 的 置信 和 度 大 于 期 望 置信 和 度 , 才 说 明 X 的 出 现 对 Y 的 出 现 有 促 

进 作 用 ,也 说 明 了 它们 之 间 某 种 程度 的 相关 性 ;如 果 作 用 度 不 大 于 1, 则 此 关联 规 
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则 也 就 没有 意义 了 。 应 该 指出 ,在 这 四 种 度量 中 ,最 常用 的 是 置信 度 和 支持 度 。 
表 13.1 关联 规则 的 四 个 度量 参数 






















在 数据 项 X 出 现 的 前 提 下 , Y 出 现 的 概率 | P(Y|X) 
支持 度 数据 项 X、Y 同时 出 现 的 概率 P(XN Y) 





P(Y) 
P(Y|X)/P(Y) 


数据 项 Y 出 现 的 概率 
置信 度 对 期 望 置 信 度 的 比值 








4. 单 维 布尔 关联 规则 的 挖掘 与 优化 


最 简单 的 关联 规则 是 单 维 、 单 层 的 布尔 关联 规则 。Agrawal 等 于 1993 年 首先 
提出 了 挖掘 事务 数据 库 中 项 集 间 的 关联 规则 问题 ,其 核心 方法 是 基于 频 集 理论 的 
递归 方法 , 即 Apriori 算法 。 该 算法 将 关联 规则 挖掘 算法 的 设计 分 解 为 两 步 : 

(1) 找到 所 有 支持 度 大 于 最 小 支持 度 的 项 集 , 这 些 项 集 称 为 频 集 。 含 有 & 个 
项 的 频 集 称 为 已 项 集 。 

(2) 使 用 第 (1) 步 找到 的 频 集 产 生 所 期 望 的 规则 。 对 于 每 个 频 集 4 , 若 BS 
4,B 和 天; 且 Confidence(B->(A 一 B)) 之 mincon{, 则 构成 关联 规则 B 一 (A 一 B)。 

第 (2) 步 相对 简单 。 这 里 只 考虑 规则 的 右边 只 有 一 项 的 情况 。 如 果 给 定 了 一 
个 频 集 了 = 了 ,了 T,…,,k 之 2, TET, 那 么 ,只 包含 集合 1 卫 , I，，,…, 了 | 中 的 项 的 
规则 最 多 有 条 。 这 种 规则 形 如 I, 了,… ,了 741,… ,本 闻 1;,1 志 1 夺 k&。 在 这 些 规 
则 中 ,只 有 那些 置信 度 大 于 用 户 给 定 的 最 小 置信 和 度 的 规则 才 被 留 下 来 。 

Apriori 算 法 是 一 种 最 有 影响 的 挖掘 布尔 关联 规则 频繁 项 集 的 算法 。 该 算法 
为 了 生成 所 有 频 集 ,使 用 了 递归 的 方法 , 伪 代 码 描述 如 下 : 

Apriori 算法 

输入 :D,minsup 
输出 :Result= 所 有 的 频 集 和 它们 的 支持 度 。 
方法 : 
Li = {large l-itemsets} ; 
for (k=2;Ik -1B;k+ + ) do begin 
Gr = aptiori-gen(L _1); 
for all 事务 项 transactions t€D do begin 
C= subset( Gx,t); 
for all 候选 项 candidates cE C do 


cC。count 十 十 ; 
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end 

Li = {cE GQ |e.countS>minsup} 
end 
Result = Uy Lo 

该 算法 是 宽度 优先 算法 ,首先 产生 频繁 1- 项 集 L1 ,然后 是 频繁 2- 项 集 L,, 直 
到 有 某 个 ~ 值 使 得 L, 为 空 ,这 时 算法 停止 。 在 第 & 次 循环 中 , 先 产生 候选 -项 集 
的 集合 Gi , Cx 中 的 每 一 个 项 集 是 对 两 个 只 有 一 个 项 不 同 的 属于 工 ,_1 的 频 集 做 一 
个 (一 2)- 连 接 来 产生 的 。C 中 的 项 集 是 用 来 产生 频 集 的 候选 集 , 最 后 的 频 集 Lx 
必须 是 Cx 的 一 个 子 集 。Cx 中 的 每 个 项 需要 在 事务 数据 库 中 进行 验证 来 决定 它 是 
否 加 入 Li。 这 里 的 验证 过 程 需要 很 大 的 输入 /输出 开销 ,严重 影响 该 算法 的 使 用 
效果 。 因 为 这 个 方法 要 求 多 次 扫描 可 能 很 大 的 事务 数据 库 , 如果 频 集 最 多 包含 
个 项 ,那么 就 需要 扫描 事务 数据 库 mm 遍 。 

为 改进 算法 的 性 能 ,Agrawal 等 引 人 了 剪 枝 技 术 来 减 小 候选 集 Ci 的 大 小 , 效 
果 很 显著 。 算 法 中 引入 的 修剪 策略 基于 这 样 一 个 性 质 : 一 个 项 集 是 频 集 当 且 仅 当 
它 的 所 有 子 集 都 是 频 集 。 因 此 ,如 果 Ci 中 某 个 候选 项 集 有 一 个 (k 一 1)- 子 集 不 属 
于 Ls-1, 那 么 ,这 个 项 集 就 可 以 被 修剪 掉 而 不 再 被 考虑 。 这 个 修剪 过 程 可 以 降低 
计算 所 有 的 候选 集 的 支持 度 的 代价 。 也 可 以 使 用 杂凑 树 (hash tree) 方 法 来 有 效 地 
计算 每 个 项 集 的 支持 度 。 

Apriori 算法 在 实际 的 应 用 中 ,还 是 存在 不 满意 的 地 方 ,人 们 相继 提出 了 一 些 
优化 的 方法 。 

(1) 基于 划分 的 方法 : 先 把 数据 库 从 逻辑 上 分 成 几 个 互 不 相交 的 块 ,每 次 单独 
考虑 一 个 分 块 并 对 它 生 成 所 有 的 频 集 , 然 后 把 产生 的 频 集合 并 ,用 来 生成 所 有 可 能 
的 频 集 ,最 后 计算 这 些 项 集 的 支持 度 。 分 块 的 大 小 选择 应 该 能 满足 每 个 分 块 都 可 
以 被 放 人 主 存 ,每 个 阶段 只 需 被 扫描 一 次 。 

(2) 基于 采样 的 方法 : 先 使 用 从 数据 库 中 抽取 出 来 的 采样 得 到 一 些 在 整个 数 
据 库 中 可 能 成 立 的 规则 ,然后 对 数据 库 的 剩余 部 分 验证 这 个 结果 。 这 种 算法 相当 
简单 ,并 能 够 显著 减少 输入 /和 葵 出 代价 。 但 是 ,这 种 算法 也 有 一 个 很 大 的 缺点 ,产生 
的 结果 不 精确 :分布 在 同一 存储 区 域 上 的 数据 时 常 是 高 度 相关 的 ,有 时 不 能 表示 整 
个 数据 库 中 模式 的 分 布 。 

(3) 减少 交易 的 个 数 : 当 一 个 事务 不 包含 长 度 为 & 的 频 集 时 ,必然 不 包含 长 度 
为 &+1 的 频 集 。 因 此 ,就 可 以 将 这 些 事务 移 去 ,在 下 一 遍 的 扫描 中 就 可 以 减少 扫 
描 事务 集 的 个 数 。 


5. 多 层 关联 规则 的 挖掘 
对 于 很 多 应 用 来 说 ,由 于 数据 分 布 的 稀疏 性 ,很 难 在 低层 或 数据 最 细节 的 层次 
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上 发 现 一 些 强 关联 规则 。 概 念 层次 的 引入 ,使 得 人 们 能 够 在 较 高 的 概念 层次 上 进 
行 数 据 挖掘。 虽然 较 高 层次 上 得 出 的 规则 可 能 具有 更 普遍 的 意义 ,但 是 , 某 个 规则 
对 于 一 个 用 户 而 言 具 有 普遍 意义 ,对 于 男 一 个 用 户 而 言 却 是 新 颖 的 。 因 此 ,数据 挖 
掘 系统 应 该 能 够 在 多 个 抽象 层 上 挖掘 关联 规则 。 在 多 个 概念 层 的 项 之 间 寻 找 有 趣 
的 关联 比 仅 在 原始 层 数据 之 间 搜 寻 更 为 容易 。 根 据 规 则 中 涉及 到 的 层次 ,多 层 关 
联 规则 可 以 分 为 同 层 关联 规则 和 层 间 关联 规则 。 

多 层 关联 规则 的 挖掘 可 以 基于 支持 度 - 置 信和 度 框架 。 一 般 来 说 ,可 以 采用 自 顶 
向 下 的 策略 ,由 最 高 概念 层 向 下 ,到 较 低 的 更 特定 的 概念 层 ,对 每 个 概念 层 计算 频 
繁 项 集 累 加 计数 ,直到 不 能 再 找到 频繁 项 集 。 对 于 每 一 层 ,可 以 使 用 已 有 的 发 现 频 
繁 项 集 的 任何 算法 来 寻找 频繁 项 集 。 对 于 支持 度 的 设置 ,通常 有 两 种 考虑 : 

(1) 对 于 所 有 层 采 用 相同 的 最 小 支持 度 。 这 种 设置 ,算法 比较 容易 实现 ,但 是 
其 次 端 也 很 明显 。 最 小 支持 度 阐 值 设 置 太 高 ,可 能 发 现 不 了 较 低 抽 象 层 中 有 意义 
的 关联 规则 ,最 小 支持 度 阐 值 设置 过 低 ,会 生成 太 多 的 高 层 关联 规则 ,发 现 的 高 层 
关联 规则 中 有 很 多 并 没有 什么 实际 意义 。 

(2) 在 较 低 层 使 用 递减 的 最 小 支持 度 。 每 个 层次 都 有 不 同 的 最 小 支持 度 , 较 
低层 次 的 最 小 支持 度 相对 较 小 。 

对 于 具有 递减 最 小 支持 度 的 多 层 关联 规则 的 挖掘 ,有 四 种 常用 的 搜索 策略 , 即 
逐 层 独立 ` 层 交叉 单项 过 滤 、 层 交叉 久 项 集 过 滤 、 受 控 的 层 交 叉 过 滤 。 逐 层 独立 的 
方法 是 一 种 完全 的 宽度 搜索 方法 ,对 于 每 个 结 点 ,无 论 其 父 结 点 是 否 是 频繁 项 集 ， 
都 要 进行 考察 ,在 搜索 过 程 中 不 进行 剪 校 操 作 。 这 种 方法 条 件 宽松 ,可 能 在 低层 会 
考察 大 量 的 非 频繁 的 项 集 ,挖掘 出 一 些 不 太 重 要 的 关联 规则 。 层 交叉 单项 过 滤 的 
方法 中 采用 了 由 较 一 般 的 关联 考察 更 特殊 的 关联 的 前 校 策 略 。 如 果 一 个 结 点 是 频 
繁 的 , 它 的 子 结 点 将 被 考察 ,否则 , 它 的 子 结 点 将 从 搜索 中 被 剪 校 。 这 种 方法 可 能 
会 丢失 一 些 低 层 的 关联 规则 。 层 交叉 &- 项 集 过 滤 的 方法 限制 较 严 ,对 于 一 个 第 i 
层 的 色 项 集 而 言 ,而 且 仅 当 它 在 第 i -1 层 的 对 应 父 结 点 项 集 是 频繁 的 , 它 才 被 
考察 。 这 样 的 限制 ,可 能 会 过 滤 掉 一 些 有 价值 的 模式 。 受 控 的 层 交 又 过 滤 策 略 比 
较 灵活 , 它 允 许 考察 不 满足 最 小 支持 度 阔 值 的 子 结 点 。 通 过 增加 控制 机 制 ,增强 了 
多 层 挖 掘 的 灵活 性 ,减少 了 无 意义 关联 的 考察 和 产生 。 


6. 多 维 关联 规则 的 挖掘 

1) 多 维 关联 规则 的 挖掘 及 其 分 类 

对 多 维 数据 库 进行 挖掘 时 ,往往 对 多 维 属 性 之 间 的 关联 感 兴趣 。 通 常 ,引入 一 
阶 钦 辑 谓词 来 表示 多 维 关联 规则 ,其 中 请 词 表示 维 ,谓词 中 的 一 个 项 表示 某 个 对 


象 ,其 他 项 表示 维 中 的 某 些 属性 。 
根据 同一 维 在 同一 规则 中 能 否 重复 出 现 ,可 以 将 多 维 关联 规则 细 分 为 维 间 的 
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关联 规则 和 混合 维 关联 规则 ,前 者 不 允许 维 重 复出 现 ,后 者 允许 维 在 规则 的 左右 同 
时 出 现 。 

在 进行 多 维 关联 规则 的 挖掘 时 ,还 要 考虑 属性 的 类 型 。 把 数据 库 属性 分 为 两 
种 类 型 ,一 种 称 分 类 属性 ,也 称 标 称 属性 ,为 一 种 称 量化 属性 ,是 数值 型 的 。 分 类 属 
性 具有 有 限 个 不 同 的 值 ,并 且 值 之 间 没 有 顺序 ,而 量化 属性 的 值 之 闻 存 在 着 隐 含 的 
顺序 。 对 分 类 属性 ,原先 的 分 类 算法 都 可 以 使 用 ,而 对 量化 属性 , 则 需要 进行 一 定 
的 预 处 理 。 根 据 处 理 量化 属性 的 方法 ,可 以 将 涉及 量化 属性 的 关联 规则 分 为 静态 
数量 关联 规则 、 量 化 关联 规则 、 基 于 距离 的 关联 规则 等 类 型 。 

(1) 挖掘 静态 数量 关联 规则 :使 用 预定 义 的 概念 分 层 对 量化 属性 进行 离散 化 ， 
经 过 这 种 处 理 后 得 出 的 规则 称 为 静态 数量 关联 规则 。 在 挖掘 之 前 , 先 用 概念 层次 
将 量化 属性 离散 化 ,数值 被 替换 为 区 间 范 围 。 必 要 时 ,将 分 类 属性 泛 化 到 较 高 的 概 
念 层 。 本 节 给 出 的 BUC 算法 即 为 此 类 。 

(2) 挖掘 量化 关联 规则 ;根据 数据 的 分 布 ,动态 地 将 量化 属性 离散 化 到 “ 箱 ”， 
数值 型 数据 被 处 理 成 量 , 而 不 是 预定 义 的 区 间或 分 类 ,经 过 这 种 处 理 得 出 的 规则 称 
为 量化 关联 规则 。 对 于 量化 关联 规则 ,将 只 关注 一 类 特殊 的 二 维 规则 。 该 类 规则 
只 包含 两 个 量化 维 , 规 则 左边 是 量化 属性 ,右边 是 一 个 分 类 属性 。 

(3) 挖掘 基于 距离 的 关联 规则 :用 分 箱 的 方法 对 量化 属性 进行 离散 化 ,不 能 体 
现 数据 间隔 的 语义 。 采 用 基于 距离 的 方法 对 量化 属性 进行 离散 化 可 以 避免 这 种 不 
足 。 基 于 距离 的 划分 既 考 虑 了 区 闻 内 点 的 个 数 ,又 可 以 表达 区 间 内 点 的 接近 性 ,这 
样 的 划分 有 助 于 更 有 意义 的 离散 化 。 每 个 量化 属性 的 区 间 划 分 可 以 通过 对 该 属性 
的 值 进行 聚 类 得 到 。 一 个 两 遍 算 法 可 以 用 于 挖掘 基于 距离 的 关联 规则 。 第 一 所 使 
用 聚 类 找 出 区 间或 篮 ,第 二 遍 搜 索 频 繁 出 现在 一 起 的 簇 组 ,并 由 这 些 复 组 构成 关联 
规则 。 


2) 改进 的 BUC 算法 


定义 多 维 事务 数据 库 DD 的 结构 为 (DD,A1,As,…,A, ,items) ,其 中 ID 为 每 一 
个 事物 在 数据 库 中 的 唯一 标识 , A; 是 数据 库 中 的 结构 化 属性 ,并 且 items 是 同 给 定 
事务 所 连接 的 项 的 集合 。 每 一 个 事务 人 工 = (这 ,aiyaz，…an;items-t) 中 所 包含 的 
信息 可 以 划分 为 两 个 部 分 : 维 部 分 (a1,a2,…, a) 和 项 集 部 分 (items-t)。 一 般 将 
挖掘 的 过 程 划 分 为 两 个 部 分 ,首先 挖掘 关于 维度 信息 的 模式 ,然后 从 投影 的 子 数据 
库 中 查找 出 频繁 项 集 , 反 之 亦 然 。 下 面 使 用 表 13.2 中 的 多 维 数据 库 D 来 演示 第 
一 个 步骤 。 
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表 13.2 多 维 事务 数据 库 D 























可 以 首先 查找 频繁 多 维 值 的 组 合 , 然 后 寻找 数据 库 中 相应 的 频繁 项 集 。 假 定 
表 13.2 中 数据 库 DD 的 立 值 为 2。 然 后 ,属性 值 的 组 合 如 果 出 现 两 次 或 两 次 以 上 ， 
那么 它 就 是 频繁 的 ,并 且 称 为 多 维 模 式 或 叫做 MD- 模 式 。 在 挖掘 MD- 模 式 时 ,可 
以 使 用 最 早 由 Beyer 和 Ramakrishnan 开发 的 改进 的 BUC 算法。 改进 的 BUC 算 法 
的 基本 步骤 如 下 : 

首先 ,在 第 一 维 (Ai) 中 按 值 的 字母 顺序 将 每 个 项 进行 排序 。 因 为 属性 Ai 的 
值 使 用 字母 来 表示 ,所 以 排序 也 是 按照 字母 而 不 是 数字 的 顺序 来 排序 。 

(1) 在 该 维 中 仅 有 的 MD- 模 式 为 (a, x* , x ), 因 为 只 有 4 值 出 现 了 两 次 。 其 
他 值 bs 和 < 值 出 现 了 一 次 ,所 以 它们 就 不 属于 MD- 模式 。 其 他 两 个 维 的 值 ( x ) 代 
表 它们 在 第 一 步 中 不 相关 ,而 且 可 以 是 允许 的 值 的 任意 组 合 。 在 数据 库 中 选择 那 
些 具 有 MD- 模 式 的 项 。 在 该 例子 中 ,它们 是 ID 为 01 和 03 的 样本 。 针 对 第 二 维 
(A2), 值 为 1 和 2, 对 简化 的 数据 库 进 行 再 一 次 排序 。 因 为 没有 出 现 过 两 次 的 模 
式 , 所 以 不 存在 A; 和 A; 值 的 MD- 模 式 。 因 此 可 以 忽略 第 二 维 A,( 该 维 不 会 再 
简化 数据 库 )。 在 下 一 步 中 将 会 用 到 所 有 被 选择 的 项 。 在 第 三 维 (A;) 中 按 字 母 顺 
序 将 每 个 项 进行 排序 。 子 群 (a , * , m ) 包 含 在 两 个 项 中 ,并 且 它 是 一 个 MD- 模 式 。 
因为 在 该 例子 中 已 经 没有 其 他 维 , 所 以 开始 第 二 步 的 搜索 。 

(2) 重复 步骤 (1) 的 过 程 : 只 从 第 二 维 而 不 是 第 一 维 开始 搜索 。 在 以 下 迭代 
中 ,无 需 搜索 第 一 维 ,所 以 一 开始 就 减少 了 搜索 的 过 程 。 在 该 例子 中 ,第 二 次 迭代 
从 属性 A, 开始 , MD- 模 式 为 ( x ,2, * )。 除 了 维 A;, 不 存在 其 他 MD- 模 式 。 在 该 
例子 中 的 最 后 一 次 迭代 ,从 维 A; 开始 ,相应 的 模式 为 (x ,x ,zm )。 

总 之 ,改进 的 BUC 算法 定义 了 一 个 MD- 模 式 集 以 及 相应 的 数据 库 投 影 。 在 
图 13.1 中 列 出 了 例子 中 数据 库 DD 的 数据 处 理 树 。 对 于 更 大 数量 的 维 也 会 产生 同 
样 的 树 。 

当 找到 所 有 MD- 模 式 后 ,分 析 多 维 事务 数据 库 的 下 一 步 ,就 是 对 每 个 MD- 模 
式 在 MD- 投 影 中 可 以 应 用 Apriori 算法 等 方法 挖掘 频繁 项 集 。 另 一 个 方法 就 是 在 
首先 挖掘 出 频繁 项 集 的 基础 上 ,再 挖掘 相应 的 MD- 模 式 。 
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图 13.1 使 用 改进 的 BUC 算法 得 到 的 数据 处 理 树 


13.5 回归 分 析 


在 复杂 的 地 理 信息 系统 中 , 某 些 要 素 容 易 被 预测 和 控制 ,而 另外 一 些 要 素 的 变 
化 则 很 难 预 测 和 控制 。 如 果 能 建立 起 易 被 控制 的 要 素 与 不 易 被 控制 的 要 素 之 间 的 
一 种 近似 的 函数 表达 式 , 则 具有 很 大 的 实用 意义 。 数 理 统 计 学 中 的 回归 分 析 法 就 
是 研究 要 素 之 间 具 体 数 量 关系 的 一 种 强 有 力 的 手段 。 回 归 分 析 是 由 一 组 预测 变量 
〈 自 变量 ) 值 去 预测 一 个 或 多 个 响应 变量 ( 因 变 量 ) 值 的 一 种 统计 方法 ,这 种 方法 也 
能 用 于 佑 计 预 测 变量 对 响应 变量 的 效应 ,其 目的 之 一 是 要 建立 要 素 之 间 的 相关 关 
系 模型 一 一 回归 分 析 模 型 。 

在 复杂 的 地 理 系统 中 ,各 要 素 之 间 既 有 线性 关系 ,也 有 非 线性 关系 。 因 此 ,地 
理 要 素 之 间 的 回归 分 析 模 型 , 既 有 线性 回归 模型 ,也 有 非 线 性 回归 模型 。 但 许多 非 
线性 回归 模型 可 通过 变量 变换 转化 为 线性 模型 进行 处 理 。 因 此 ,本 节 主 要 介绍 线 
性 回归 模型 中 的 一 元 (一 对 一 ) 线 性 回归 模型 .多 元 (一 对 多 ) 线 性 回归 模型 ,最 后 介 
绍 非 线性 回归 模型 。 


13.5.1 一 元 线性 回归 模型 


一 元 线性 回归 模型 描述 的 是 两 个 要 素 (变量 ) 之 间 的 线性 相关 关系 。 设 有 两 个 
要 素 ( 变 量 )z 和 y,z 是 自 变量 , > 是 因 变量 ,上 且 关于 x 和 y 有 x 组 实测 值 。 以 xz 
为 横 坐 标 , y 为 纵 坐 标 作 散 点 图 , 若 这 x 个 点 落 在 一 直线 附近 ,从 统计 上 讲 即 y 随 
z 的 变化 而 线性 变化 , 则 认为 zx 和 y 之 间 可 配 一 元 线性 回归 方程 。 其 基本 结构 形 
式 为 





y= at+brit+e; (i = 1,2,.…,n) (13.6) 


式 中 ,a 和 2 为 待定 参数 ;e; 为 随机 变量 。 如 果 记 4a 和 5 分别 为 参数 a 和 6 的 拟 合 
值 , 则 一 元 线性 回归 模型 为 
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和 ~ 


y=a+hr (13.7) 
式 (13.7) 代 表 z 与 y 之 间 相 关 关系 的 拟 合 直线 , 称 为 回归 直线 ; y 是 y 的 估计 值 ， 
称 为 回归 值 ;6 称 为 回归 系数 , 它 是 回归 直线 的 斜率 ;2 为 回归 常数 , 它 是 回归 直线 
的 截 距 。 


1. 参数 a、b 的 最 小 二 乘 估计 
实际 观测 值 y; 与 回归 值 y; 之 差 e; = y; - yx, 刻画 了 实际 观测 值 与 回归 估计 值 
之 间 的 偏离 程度 。 要 求 得 回归 估计 值 ,一 个 直观 的 想法 就 是 希望 e; 达到 最 小 ,为 


此 通常 采用 最 小 二 乘法 , 它 就 是 要 选择 参数 a、5 ,使 误差 e; 的 差 值 平方 和 达到 最 
小 。 即 


Q= De= Dy -= Dy a- br) min 
i=1 i=1 i=1 


由 于 Q(a,65) 是 4a、6b 的 非 负 二 次 函数 ,其 最 小 值 必 存 在 ,同时 它 是 a、b 的 可 
微 函数 , 故 根据 微 积分 学 中 的 极 值 原理 ,a 和 5 应 是 下 列 方程 组 的 解 : 





2- 29 (% -a br) =0 
aa (13.8) 
a6 =-29(% 二 一 bz; ) I: 三 0 
即 
让 zi)b = Dy, 
(13.9) 
(2 zi)a + (2 x1) = 2) roy 
=1 i=1 =1 
式 (13.9) 通 常 被 称 为 正规 方程 组 , 解 该 方程 组 ,可 得 到 参数 a、b 的 拟 合 值 : 
a=y-hr 
如 I n 1 nn n 
L 2 (zi — x)(y—y) 2) zz 一 一 ( > zi)( y;) 
= zy _ il il Nn j=1 i=1 
(ny Dt- a) 
式 中 ,和 5 分别 为 z 和 为 (i =1,2,…,) 的 平均 值 , 即 z = 二》) x,y = 
3 Vio 


Nn i=1 
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建立 一 元 线性 回归 模型 的 过 程 ,就 是 用 变量 x; 和 y; 的 实际 观测 数据 确定 参 
数 a、&5 的 最 小 二 乘 估计 值 4 和 5 的 过 程 。 
2. 一 元 线性 回归 模型 的 显著 性 检验 


由 于 实际 的 计算 过 程 并 不 要 求 x 与 y 具有 相关 关系 ,因此 ,即使 杂乱 无 章 的 
数据 依然 可 以 求 得 一 元 线性 回归 方程 ,但 是 这 样 的 方程 是 毫 无 意义 的 。 而 只 有 当 
个 点 落 在 一 直线 附近 ”, 才 认为 zx 和 >y 之 间 可 配 一 元 线性 回归 方程 , 即 式 中 的 5 
不 能 为 0。 此 时 ,问题 变 为 检验 5=0 是 否 为 真 , 若 5=0, 则 当 z 变化 时 ,y 并 不 随 
xz 而 线性 变化 ;反之 , 若 5 取 0, 则 y 随 z 而 线性 变化 ,这 时 的 回归 方程 才 有 意义 。 
为 检验 假设 5=0 是 否 为 真 ,可 以 从 分 析 引 起 因 变量 变化 的 原因 着 手 。 其 一 ， 
若 y 是 随 z 线性 变化 的 ,那么 z 的 取 值 不 同 就 是 一 个 原因 ;其 二 是 其 他 一 切 因 素 
的 影响 。 在 回归 分 析 中 ,y 的 2” 次 观测 值 之 间 的 差异 ,可 用 观测 值 y; 与 其 平均 值 y 
的 离 差 平方 和 来 表示 , 即 总 的 离 差 平方 和 , 记 为 


Sg = Ly, =- Dy 一 了 )2 (13.10) 
总 的 离 差 平方 和 反映 了 各 观测 值 y; 的 波动 大 小 ,5 可 证 明 


Sg= Ly, = Ds -y) 
= D+ DS) 
=Q+U (13.11) 
Rs 
U 反映 了 由 于 的 变化 所 引起 的 波动 大 小 , 称 为 回归 平方 和 ; Q = > (> - 


多 ) 关 反映 了 观测 值 与 回归 直线 间 的 偏离 ,这 是 由 其 他 一 切 因素 引起 的 , 称 为 剩余 平 
方 和 (或 残 差 平 方 和 )。 

若 方程 有 意义 ,总 是 希望 U 对 上 L, 的 贡献 越 大 ,而 Q 的 影响 越 小 ,这 样 回归 模 
型 的 效果 就 越 好 。 那 么 U 大 到 什么 程度 才 认 为 方程 是 有 意义 的 呢 ? 

在 假定 各 s; 相互 独立 , 且 均 服从 数学 期 望 为 0、 方 差 为 o? 的 正 态 分 布 ( 简 记 为 
si 一 N(0,o2)) 的 条 件 下 ,可 证 明 

(1) Q/o*~zx(n -2); 

(2) 在 5=0 的 条 件 下 ,UL 一 z2(1); 

(3) 口 与 Q 相互 独立 。 
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式 中 , zx?(/) 为 自由 度 是 / 的 x? 分 布 。 因 此 ,在 5=0 人 
FF(1,n -2),F(, 户 ) 表 示 自 由 度 为 广 、 户 的 到 分 布 ,对 给 定 的 显著 性 水 平 a, 当 
下 > 下 (1 -2) 时 ,认为 5 天 0, 此 时 相对 于 其 他 因素 而 言 , > 随 x 的 变化 是 重要 
的 , 称 方程 是 显著 的 ;反之 , 称 方程 不 显著 。 这 种 用 下 检验 对 回归 方程 做 显著 性 检 
验 的 方法 称 为 方差 分 析 。 

另 一 种 考察 y 与 之 间 是 否 有 线性 相关 关系 的 方法 ,是 用 zx; 与 y 之 间 的 相 


关系 数 r 来 衡量 。 相 关系 数 x 的 计算 公式 (13.1), 它 与 回归 系数 、 各 偏差 平方 和 
及 下 比 之 闻 有 下 述 关系 : 


Ls Ly IL | 
到 er 
Lexx Ly » 
i 0 


上 Ry 


工 二 一 es 
U U (n — 2)r? 
F=(n-2)= (n -2) 
Q 总 


Su—U 工 一 7 

由 上 述 可 知 : 

(1) 由 于 U 志 Sg ,因此 |r| 志 1; 

(2) r=0 表示 L,,=0, 即 =0, 此 时 说 明 y 不 随 x 线性 变化 ; 

(3) 1r|=1 表 示 U=Sg, 即 Q=0, 此 时 7 个 点 全 落 在 回归 直线 上 , 即 完 全 
线性 相关 ; 

(4) 一 般 情 况 下 0<|r|<1,y 与 zx 之 间 存 在 一 定 的 线性 相关 关系 。 

由 式 (13.12) 可 知 下 是 x 的 增 函 数 , 故 当 |r| 大 到 一 定 程度 而 使 F>F,(1,n 
一 2) 时 ,就 认为 zx 与 y 线性 相关 ,因此 也 可 以 用 相关 系数 检验 5 =0 是 否 为 真 。 在 
一 些 统计 书 中 列 有 相关 系数 临界 值 r,(n 一 2)。 当 | xr|>>r,(n 一 2) 时 ,认为 在 a 水 
平 上 z 与 y 线性 相关 , 即 5 了 关 0。 相 关系 数 检验 与 下 检验 的 结论 是 一 致 的 。 











(13.12) 


13.5.2 多 元 线性 回归 模型 


在 多 要 素 的 地 理 信息 系统 中 ,除了 在 某 两 个 要 素 之 间 存 在 相互 作用 、 相 互 影响 

的 关系 外 ,更 多 的 是 若干 个 (多 于 两 个 ) 要 素 之 间 也 存在 相互 制约 的 关系 。 因 此 ,多 

元 线性 回归 模型 就 带 有 更 普遍 性 的 意义 。 多 元 线性 回归 模型 描述 的 是 一 个 因 变 量 

受 多 个 自 变量 影响 的 情况 ,现在 如 果 用 图 形 来 判断 它们 之 间 有 无 相关 关系 就 比较 

困难 ,通常 的 做 法 是 根据 经 验 或 者 先 假定 一 个 模型 ,然后 再 做 检验 以 决定 模型 是 否 
正确 。 
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假设 某 一 因 变 量 y 受 & 个 自 变 量 z1,x2，,… ,zs 的 影响 ,其 n 组 观测 值 为 (y,， 
Xol; Ta2，"… ;Xk),Q 二 1,2,…,n。 则 多 元 线性 回归 模型 的 结构 形式 为 
Ya = Bot Bixat + Baxaz + *** + Bexop + (13.13) 
式 中 , Bo， pi， ,Be 为 待定 参数 ; e。 为 随机 变量 。 如 果 20， bi 3 by 分 别 为 Bo, 
Bi,**, Be: 的 拟 合 值 , 则 得 回归 方程 


y= bo+ bizi + br2 + + ber (13.14) 


式 中 ,bo 为 常数 ;51,52,… ,bi 称 为 偏 回 归 系 数 , 它 的 意义 在 于 当 其 他 自 变 量 x;(j 
闫 让 都 固定 时 , 自 变量 x; 每 变化 一 个 单元 而 使 因 变 量 平均 改变 的 数值 。 


1. 参数 b; 的 最 小 二 乘 估计 


根据 最 小 二 乘法 原理 ,有 的 估计 值 6 要 使 Q = > (》 各)? 一 min 
直 表 村 的 必要 条件 人 
=-22(x- = 0 


py i — ye) xa 0(j = 1,2,.…,k) 
了 a=1 
上 式 经 展开 整理 后 可 得 正规 方程 如 下 
nbo 十 (2 men 十 (2 ra) 二 十 (2 za )or = 2 


(2 xa)bo 十 (2 zu)b + (2 zoo2) ob RM (2 ra 多 = 2 tat 
(2 zo2)60 + {2 xara ) bh 十 (2 2)0 二 (2 zoaza oe = 2 Tay 


soreroeeoseoseerorsesooor tereeeaesr toeseoorroee oso ro oesseor oro eoseorerrosass 


(Da)bor Dan) + (Paara)st + (DA) = Do 
如 果 引 入 记号 

n 二 n 1 n n 

L; = L;; = 之 (Za — Ti) (zy 一 石 ) = 2 TaiTa 3 zxa) (2 而 | 


a=1 a=1 


(i,7 = 1,2,.…,k) 
. 1 ; 
Li, = > (zx — zi) (和 一 y) = 2 aiya > za) (2 ya) 
(i = 1,2,.…,k) 
则 正规 方程 组 也 可 以 写成 
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Liibi+ Lizb2 + + + Libs = Liy 
了 2101 十 了 2202 + + Lorbe = L2y 


ER Eg NE (13.15) 
Libit Leb2 + + Lbs = Ley 
bo = y 3 b1X1 一 6272 一 一 Derk 
2. 多 元 线性 回归 模型 的 显著 性 检验 
对 回归 方程 的 检验 是 指 检验 假设 
Ho:bo0=61=*…=6b,=0 


当 Ho 为 真 时 ,说 明 无 论 1，Z2， ,Xk 如 何 变化 ,y 并 不 随 之 而 改变 ;而 当 Ho 
不 真 时 ,说 明 5b0,51,… ,bk 中 至 少 有 一 个 不 等 于 0, 从 而 y 至 少 随 xz1 ,x2，,… ,x 之 
一 的 变化 而 线性 变化 。 因 此 ,这 里 对 回归 方程 的 检验 是 从 整体 上 看 y 与 zt zx2， 

…, zh 之 间 是 否 存在 线性 相关 的 关系 。 

与 一 元 线性 回归 模型 一 样 , 因 变量 y 的 观测 值 之 间 的 波动 或 差异 ,是 由 不 同 
的 自 变量 取 值 和 其 他 随机 因素 两 个 原因 引起 的 。 为 此 对 回归 模型 进行 方差 分 析 ， 
将 总 的 离 差 平方 和 分 解 成 两 个 部 分 , 即 回归 平方 和 LU 和 剩余 平方 和 Q : 

Su =LIv=U+Q (13.16) 


U = 26- 站 二 Cs 2 Se 

多 元 线 | 隆 回归 分 析 中 ， 回归 平方 和 表示 所 有 个 自 变量 对 》 的 变 差 的 总 影响 ， 
U 和 Q 所 代表 的 意义 与 一 元 线性 回归 分 析 中 完全 相似 。 但 在 多 元 线性 回归 分 析 
中 ,各 平方 和 的 自由 度 不 同 ,回归 平方 和 UU 的 自由 度 等 于 自 变量 的 个 数 & ,而 剩余 
平方 和 的 自由 度 等 于 n 一 一 1, 可 以 证 明 : 

(1) Q/o ~ zh; 

(2) 在 Ho 为 真 时 ， DUAL 一 zz; 

(3) U 和 Q 相互 独立 。 

U/Ek 


从 而 在 Ho 为 真 时 ,P= 二 7 一 ~ F(k,n 一 k 一 1)。 对 给 定 的 显著 性 水 


平 a, 当 下 >F,(k,n 一 k 一 1), 认 为 y 与 x1,Xx2,…,Zz 之 间 存 在 一 定 的 线性 相关 
关系 。 
实际 应 用 中 也 常用 复 相关 系数 R 去 衡量 方程 的 好 坏 , R 的 定义 如 下 
R= U/Sy (13.17) 
因为 Sg = U+Q,QZE0, 故 0 委 R2 入 1,R? 值 越 大 表示 回归 方程 越 好 。R? 与 
下 关系 如 下 : 
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3 kF 
Sn kAFE +(n=E—1) 


由 式 (13.18) 可 知 , R? 随 下 单调 递增 。 此 外 ,又 可 证 明 R 是 y 与 ye 之 间 的 简单 
相关 系数 ,因此 ,RR 越 大 则 表明 实测 值 与 回归 值 之 间 的 线性 相关 关系 越 好 。 


3. 回归 系数 的 显著 性 检验 


回归 方程 显著 并 不 意味 着 方程 中 每 个 自 变 量 对 因 变 量 y 的 作用 都 是 显著 的 。 
当 一 个 回归 方程 中 包含 有 不 显著 变量 时 ,一 方面 对 利用 回归 方程 作 预测 和 控制 带 


来 麻烦 , 另 一 方面 还 将 增 大 > 的 方差 ,从 而 影响 预测 精度 ,为 此 就 需要 对 每 一 个 回 
归 系 数 作 显著 性 检验 , 当 有 不 显著 变量 时 ,可 从 回归 方程 中 将 它 去 掉 , 从 而 建立 精 
度 较 高 的 较为 简单 的 回归 方程 。 

为 了 对 假设 Ho;:6;=0 作 检 验 ,就 需要 找 出 一 个 能 衡量 zx; 的 作用 大 小 的 量 
来 。 通 常 采用 偏 回归 平方 和 来 衡量 各 自 变 量 对 因 变 量 贡献 的 大 小 。 已 知 回归 平方 
和 是 所 有 自 变 量 对 y 变量 总 贡献 的 度量 。 回 归 方程 中 , 自 变 量 个 数 增加 ,回归 平 
方 和 随 之 增 大 ,减少 自 变量 ,回归 平方 和 也 会 相应 减 小 。 取 消 (或 增加 ) 某 一 自 变 量 
后 ,回归 平方 和 的 减 小 (或 增 大 ) 的 数值 , 称 为 该 自 变量 的 偏 回 归 平 方 和 , 偏 回归 平 
方 和 可 以 衡量 每 个 变量 在 回归 中 所 起 作用 的 大 小 , 记 为 :Qi。 

可 以 证 明 ,在 Ho; 为 真 时 :DQ;/o 一 ziOQ, 与 Q 独立 。 


从 而 在 Ho 为 真 时 ,Fi = 二 7 人 Ey 

对 给 定 的 显著 性 水 平 a, 当 F;> FF,(1,n 一 & 一 1) 时 拒绝 Ho;, 认 为 变量 x; 对 y 
有 显著 性 影响 。 具 体 计算 中 ,可 以 证 明 Qi = b? /ciio 
式 中 ,6; 为 变量 i 的 偏 回归 系数 ;cs 为 正规 方程 组 系数 矩阵 的 逆 和 矩阵 主 对 角 线 上 第 
i 个 元 素 。 若 用 行列 式 表示 , 则 ci = Ai /A。 
式 中 ,A 是 式 (13.15) 去 掉 最 后 一 行 的 系数 行列 式 : 





(13.18) 








Lu Li … Lig 
A L21 L222 … Lg 
Le Liez Li 





Ai 是 A 中 划 去 第 i 行 第 i 列 后 留 下 的 子 行列 式 : 
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Li Li,i-1 Li,i+tl A Lix 
A Li-1,1 和 Tei et Li-1,i+1 中 二 了 ;1 
中 一 
Ti+1,1 由 和 Lirii-i Lirl,itl 的 Lirl,k 
Le Ve Lge -1 Li, i+1 Li 


当 对 回归 系数 作 显 著 性 检验 后 发 现 有 不 显著 变量 时 应 除去 该 变量 后 重新 求 
出 相应 回归 系数 的 最 小 二 乘 估计 。 但 由 于 回归 系数 间 存 在 相关 关系 , 故 当 有 几 个 
变量 不 显著 时 ,不 能 同时 将 这 些 变量 一 起 剔除 ,而 只 能 一 次 除去 下 比值 最 小 的 一 
个 不 显著 变量 ,重新 建立 回归 方程 后 再 对 变量 一 一 作 检 验 。 





13.5.3 非 线性 回归 模型 


在 复杂 的 地 理 信 息 中 ,要 素 之 间 除 了 线性 关系 外 ,还 存在 着 大 量 的 非 线 性 关 
系 。 若 能 找到 某 种 途径 将 非 线性 关系 转化 为 线性 关系 ,就 可 以 借助 于 线性 回归 模 
型 的 建立 方法 ,建立 要 素 之 间 的 非 线性 回归 模型 。 当 因 变 量 与 自 变量 为 某 种 已 知 
函数 关系 时 ,可 以 先 对 变量 直接 进行 函数 变换 。 当 它们 之 间 的 关系 不 清楚 时 ,可 先 
做 出 散 点 图 ,大致 估计 它们 之 间 的 函数 关系 。 以 下 介绍 一 些 非 线性 关系 进行 线性 
化 的 常用 例子 。 

(1) 指数 曲线 y= de 和 

令 y=lny,z =x, 则 可 将 其 转化 为 直线 形式 :y =<+pz ,其 中 <=lnd。 

(2) 对 数 曲 线 y= a + blnz 

令 y 了 =yz =Inx, 则 可 将 其 转化 为 直线 形式 :y = a + bx 。 

(3) 者 函数 曲线 y= dz 

令 y =Iny,zx = Inz, 则 可 将 其 转化 为 直线 形式 :y = a + bx ,其 中 a=Ind。 


(4) 双 曲 线 记 = 


令 六 = 地 ,z= 二 , 则 可 将 其 转化 为 直线 形式 :y =a + br。 





1 
UU} 二 
(5) S 型 曲线 y 
0 


> 
(6) 函数 乘积 yy 二 = dz， ZX: 
令 y =Iny,zl =lnzi, zz ee ,Xk 二 Inzs, 则 可 将 其 转化 为 直线 形式 : 
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y =B+pBzl +pPz +**+Bere (Bo= Ind) 
(7) 对 数 函 数 和 y= Bo+ pilnzi+ Bolnz2+… + Belnze 
令 y =y,ZX1 =lnzlzi =lnzz,…,Xk =Inzi; 则 可 将 其 转化 为 直线 形式 : 
y =PBot+Bizx1 +PBax2 + + Berg 

非 线性 关系 进行 线性 处 理 的 转化 过 程 有 时 并 不 能 保证 函数 关系 中 变量 个 数 不 

变 , 例 如 对 于 两 变量 的 多 项 式 : 
y=pBo+Bizt Bx’ + Berk 

若 令 zl = 二, XZ = 二,… ,Xk 二 ,yy = y, 则 上 式 被 转化 为 多 变量 的 线性 

模型 ; 


y =PBot+Bizft +Br2 十 十 
13.5.4 回归 分 析 与 相关 分 析 


相关 分 析 和 回归 分 析 是 研究 现象 之 间 相关 关系 的 两 种 基本 方法 。 所 谓 相关 分 
析 , 指 用 一 个 指标 来 表明 现象 间 相 互 依存 关系 的 密切 程度 。 所 谓 回归 分 析 , 是 根据 
相关 关系 的 具体 形态 ,选择 一 个 合适 的 数学 模式 ,来 近似 地 表达 自 变量 和 因 变 量 之 
间 的 数量 变化 关系 , 进而 确定 一 个 或 几 个 变量 的 变化 对 另 一 个 特定 变量 的 影响 
程度 。 

相关 分 析 和 回归 分 析 有 着 密切 的 联系 ,二 者 不 仅 具 有 共同 的 研究 对 象 ,而 且 在 
具体 应 用 时 ,往往 必须 互相 补充 。@ 相 关 分 析 需 要 依靠 回归 分 析 来 表明 现象 数量 
相关 的 具体 形式 ;@ 回 归 分 析 则 需要 依靠 相关 分 析 来 表明 现象 数量 变化 的 相关 程 
度 。 只 有 当 变量 之 间 存 在 着 高 度 相 关 时 ,进行 回归 分 析 寻 求 其 相关 的 具体 形式 才 
有 意义 。 

相关 分 析 与 回归 分 析 在 研究 目的 和 方法 上 是 有 明显 区 别 的 。@@ 相 关 分 析 研 究 
变量 之 间 相 关 的 方向 和 相关 的 程度 ,但 是 不 能 指出 变量 间 相 互 关系 的 具体 形式 ,也 
无 法 从 一 个 变量 的 变化 来 推测 另 一 个 变量 的 变化 情况 。@ 回 归 分 析 则 是 研究 变量 
之 间 相 互 关系 的 具体 形式 , 它 对 具有 相关 关系 的 变量 之 间 的 数量 联系 进行 测定 , 确 
定 一 个 相关 的 数学 方程 式 ,根据 这 个 数学 方程 式 可 以 从 已 知 量 来 推测 未 知 量 ,从 而 
为 估算 和 预测 提供 一 个 重要 的 方法 。 因 此 ,相关 分 析 可 以 不 必 确 定 变量 中 哪个 是 
自 变量 ,哪个 是 因 变 量 ,其 所 涉及 的 变量 可 以 都 是 随机 变量 。 而 回归 分 析 则 必须 事 
先 研究 确定 具有 相关 关系 的 变量 中 哪个 为 自 变 量 ,哪个 为 因 变 量 。 一 般 地 说 ,回归 
分 析 中 因 变 量 是 随机 的 ,而 把 自 变 量 作为 研究 时 给 定 的 非 随机 变量 。 
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13.6 系统 聚 类 分 析 


13.6.1 概 述 


聚 类 分 析 (clustering analysis) 又 称 为 群 分 析 、 点 群 分 析 、 簇 群 分 析 等 ,是 按照 
一 定 标准 来 鉴别 实体 或 现象 之 间 的 接近 程度 ,并 将 相 接 近 的 归 为 一 类 的 数学 方法 。 
假设 被 分 类 的 全 体 对 象 视 为 一 个 集合 口 ,所 谓 分 类 就 是 指 把 U 分 成 若干 子 集 Ui、 
Us,、…、Uk ,使 其 满足 : 

(1) UiU UU:……UU=U; 

(2) 对 任意 的 ;天 ) 有 Ui; 人 Uj;= @(i,j=1,2,…,k)。 

聚 类 的 目的 是 把 数据 划分 为 不 同 的 类 别 ,使 类 之 间 的 差别 尽 可 能 的 大 ,类 内 的 
差别 尽 可 能 的 小 。 一 般 在 聚 类 前 并 不 知道 将 要 划分 成 几 个 类 和 什么 样 的 类 , 也 不 
知道 根据 哪些 数据 来 定义 类 。 在 具体 应 用 中 ,专业 经 验 丰 富 的 用 户 应 该 可 以 理解 
这 些 类 的 含义 。 如 果 产 生 的 聚 类 结果 无 法 理解 或 不 可 用 , 则 该 聚 类 可 能 是 无 意义 
的 ,需要 回 到 原始 阶段 重新 组 织 数据 。 聚 类 结果 的 好 坏 取决 于 该 聚 类 方法 采用 的 
相似 性 评估 方法 以 及 该 方法 的 具体 实现 ,也 取决 于 该 方法 是 能 发 现 某 些 还 是 所 有 
的 隐 含 模式 。 一 个 好 的 聚 类 方法 应 该 能 产生 高 质量 的 聚 类 结果 。 这 些 类 应 该 具有 
“ 较 高 的 类 内 相似 性 , 较 低 的 类 间 相 似 性 ?的 特点 。 

聚 类 一 般 涉 及 两 阶段 的 搜索 算法 , 即 先 搜索 可 能 的 类 的 个 数 ,再 对 给 定 的 类 数 
寻找 最 佳 的 聚 类 结果 。 但 是 类 的 个 数 的 确定 通常 是 非常 困难 的 , 普遍 的 做 法 是 采 
用 各 种 寻 优 准 则 。 作 为 数据 挖掘 的 一 个 功能 , 聚 类 分 析 可 以 作为 一 个 独立 的 工具 
来 获得 数据 的 分 布 情况 .观察 每 个 类 的 特点 、 对 特定 的 类 进行 更 深入 的 分 析 , 同时 
它 也 可 以 作为 其 他 算法 的 预 处 理 步 又 。 例 如 , 先 用 聚 类 算法 对 数据 分 类 ,再 对 生成 
的 类 进行 特征 抽取 或 利用 生成 的 类 对 其 他 数据 进行 分 类 。 

我 们 把 应 用 普通 数学 方法 进行 分 类 的 聚 类 分 析 , 称 为 普通 聚 类 分 析 。 与 之 相 
对 应 的 是 模糊 聚 类 分 析 。 常 克 的 普通 聚 类 方法 有 系统 聚 类 法 、 动 态 聚 类 法 、 分 解 
法 .加 入 法 ;还 可 分 为 按 样品 聚 类 与 按 变量 (指标 ) 聚 类 两 种 ,前 者 称 为 Q 型 聚 类 
法 ,后 者 称 为 R 型 聚 类 法 。 本 节 主 要 介绍 普通 聚 类 分 析 中 常用 的 系统 聚 类 法 。 

聚 类 分 析 法 的 一 般 程序 是 :首先 确定 分 类 统计 量 , 即 选择 描述 样品 (或 指标 ) 之 
间 关 系 的 统计 量 ;其 次 规定 一 种 并 类 规则 ,利用 统计 量 将 样品 进行 归 类 。 


13.6.2 聚 类 要 素 预 处 理 


在 聚 类 分 析 中 , 聚 类 要 素 直 接 影响 着 分 类 结果 的 准确 性 和 可 靠 性 。 而 地 理 分 
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类 和 分 区 研究 中 ,被 聚 类 的 样品 往往 具有 不 同 的 单位 和 量 纲 ,其 数值 可 能 相差 很 
大 ,因此 , 聚 类 分 析 前 先 要 对 聚 类 要 素 进 行 标准 化 处 理 。 标 准 化 的 方法 主要 有 以 下 
几 种 (z3 为 标准 化 后 的 新 数据 ) : 

(1) 总 和 标准 化 


z= zo/ > zy | (13.19) 
其 结果 满足 : > x = 1 
(2) 标准 差 标准 化 
a ee 
eh . 
式 中 , xz; = 


该 标准 化 法 所 得 新 数据 的 各 要 素 的 平均 值 为 0, 标准 差 为 1。 
(3) 极 大 值 标准 化 











Ti : = 1,2,* | (13 21) 
”maxlzsl j = 1,2,°,n 
该 方法 标准 化 的 结果 均 小 于 或 等 于 1。 
(4) 极 差 的 标准 化 
Ti min| zi | i = 1,2,.…,m 
es max| zil 一 min{ zl : = ) 0 


该 方法 标准 化 的 结果 均 小 于 或 等 于 1。 
13.6.3 分 类 统计 量 


为 了 将 样品 (或 指标 ) 进 行 分 类 ,就 需要 研究 样品 (或 指标 ) 之 间 的 关系 。 常 用 
来 描述 这 种 关系 的 统计 量 是 “距离 ”和 “相似 系数 "。“ 距 离 ” 分 类 统计 量 :将 一 个 样 
品 (或 指标 ) 看 作 多 维 空间 中 的 一 个 点 ,并 在 空间 定义 距离 ,距离 越 近 的 点 性 质 越 接 
近 , 归 为 一 类 ,反之 则 归 为 不 同 的 类 ;相似 系数 "分 类 统计 量 :性 质 越 接近 的 样品 
(或 指标 ) 其 相似 系数 的 绝对 值 越 接近 1 , 而 彼此 无 关 的 样品 其 相似 系数 的 绝对 值 
越 接近 于 零 ,比较 相似 的 归 为 一 类 ,反之 归 为 不 同 的 类 。 

不 同类 型 的 指标 ,在 定义 距离 和 相似 系数 时 ,其 方法 有 很 大 差异 ,使 用 时 必须 
注意 。 实 际 问题 中 ,指标 的 类 型 常 分 为 以 下 三 种 尺度 。@ 间 隔 尺 度 :指标 用 连续 的 
量 来 表示 ,如 长 度 、 速 度 等 ;@@ 有 序 尺 度 ; 指 标 没有 明确 的 数量 表示 ,只 是 划分 了 一 
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些 有 次 序 关系 的 等 级 ,如 上 中,\ 下 三 等 ;@ 名 义 尺 度 : 变 量度 量 时 既 没 有 数量 表示 ， 
也 没有 次 序 关系 ,如 某 物体 的 红 , 白 、 蓝 三 色 。 研 究 比 较 多 的 是 间隔 尺度 ,因此 本 节 
主要 介绍 间隔 尺度 的 距离 和 相似 系数 的 定义 。 
设 有 n 个 样本 ,每 个 样本 有 p 个 指标 (变量 ) ,用 x;,; 表 示 第 i 个 样本 的 第 j 个 
lt 


指标 的 值 , 则 有 数据 矩阵 X= 。 对 2 个 样本 进行 聚 类 (Q 型 育 类 ) 








Wa 
常用 的 分 类 统计 量 是 “距离 ”; 对 p 个 变量 (指标 ) 进 行 聚 类 (R 型 聚 类 )， 乱用 且 分 
类 统计 量 是 “相似 系数 ”。 距离 和 相似 系数 统称 为 广义 距离 。 


1. Q 型 分 类 统计 量 


如 果 把 xn 个 样本 看 成 p 维 空间 的 n 个 点 , 则 各 样本 之 间 的 差异 性 就 可 以 用 它 
们 所 对 应 的 p 维 空间 中 点 之 间 的 距离 度量 。 记 d 为 第 ; 个 样品 X; 与 第 7 个 样品 
Xi 之 间 的 距离 ,常用 的 距离 有 : 

(1) 绝对 值 距离 


di = 2 [xi — za (i,7 = 1,2,.…,n) (13.23) 
(2) 欧式 距离 
人 1 
CD (13.24) 
Fat 


(3) 明科 夫 斯 其 距离 


上 1 
di = [之 | (13.25) 
显然 , 当 g=1.2 时 ,就 是 (1)、(2) 的 两 个 距离 。 

式 (13.25) 存 在 的 不 足 之 处 表现 在 :4d 与 各 指标 的 量 纲 有 关 , 因 此 当 变 量 什 
相差 悬殊 时 , 先 要 对 原始 数据 做 标准 化 处 理 ;@ 没 有 考虑 指标 之 间 的 相关 性 。 此 
外 ,从 统计 角度 看 , 欧 氏 距离 要 求 各 坐标 对 欧 氏 距离 的 贡献 是 同等 的 且 变 差 大 小 也 
相同 ,这 时 欧 氏 距离 才 合适 ,否则 可 能 导致 错误 结论 。 一 个 合理 的 做 法 是 对 坐标 加 
权 , 所 加 的 权 是 用 样本 方差 除 相 应 坐标 。 

(4) 切 比 雪夫 上 臣 离 

当 明科 夫 斯 基 上 距离 g->co 时 ,有 

di =max|zs—- zi| 1 雯 :二 (13.26) 

(5) 马 氏 (Mahalanobis) 距 离 


di (13.27: 
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式 中 ,X 为 数据 矩阵 X 的 第 i 个 样品 的 行 矢 量 的 转 置 ; S 为 数据 矩阵 的 样本 协 方 
差 阵 。 马 氏 距 离 的 优点 是 不 受 各 指标 量 纲 的 影响 , 且 排 除了 各 指标 之 间 相 关 性 的 
干扰 。 

2. R 型 分 类 统计 量 


常用 的 相似 系数 有 以 下 几 种 : 
(1) 夹 角 余弦 (矢量 内 积 ) 


SD 
= cos0; = ee (i,j = 1,2,…,p) (13.28) 
(Da) (Bs) 
式 中 ,ci 为 矢量 (x1;,z2;,… ,Xni) 与 (zz ,Zw) 之 间 的 夹 角 余 弦 。 
(2) 相关 系数 


3 (三 Ti) (Tm 一 zj) 


ee > 一) 

选择 不 同 的 距离 或 相似 系数 ,类 结果 会 有 所 差异 。 在 实际 分 类 研究 中 ,往往 

将 几 种 方法 进行 对 比 ,从 中 选择 一 种 较为 合理 的 方法 进行 聚 类 ,结果 得 到 距离 矩阵 
DD 或 者 相似 系数 矩阵 R。 





人 








1 和 甩 盖 魏 1 


3 





13.6.4 系统 聚 类 法 


系统 聚 类 法 是 应 用 较为 广泛 的 一 种 聚 类 方法 ,其 基本 算法 是 : 

(1) 从 个 类 出 发 ( 先 将 每 个 样品 视 为 一 类 ,或 将 每 个 指标 视 为 一 类 ) ,规定 样 
品 ( 或 指标 ) 之 间 的 距离 (或 相似 系数 ) ,得 到 距离 矩阵 刀 ( 或 相似 系数 矩阵 R); 

(2) 规定 类 与 类 之 间 的 距离 ,从 距离 矩阵 万 (或 相似 系数 矩阵 R) 的 非 对 角 线 
元 素 中 搜寻 特性 最 接近 的 两 个 类 。 记 这 两 个 类 为 U 和 ,它们 之 间 的 距离 记 为 
dw ,相似 系数 记 为 ru; 

(3) 合并 U 和 了 ,将 新 的 类 记 为 ( UV)。 将 矩阵 DD 或 R 中 的 元 素 更 新 :中 删 
除 原来 U 和 V 所 对 应 的 行 和 列 ;@ 给 出 类 ( UV) 与 其 余 各 类 之 间距 离 ( 或 相似 系 
数 ) 的 行 和 列 , 并 加 进 矩 阵 ; 

(4) 对 更 新 后 的 矩阵 重复 (2) (3) 步 ,直到 所 有 样品 聚 为 一 类 为 止 。 记 录 下 被 
合并 类 的 单元 号 以 及 历次 合并 的 水 平 (距离 或 相似 性 )。 

这 种 归 类 过 程 可 画 成 一 张 罕 类 谱系 图 ,从 图 中 可 确定 我 们 所 需 的 类 和 每 类 样 
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品 (或 每 个 指标 )。 类 与 类 之 间 的 距离 有 多 种 定义 方法 ,不 同 的 定义 就 产生 了 不 同 
的 系统 聚 类 方法 。 

设 有 ”个 样本 , 记 qd; 为 第 i 个 样本 X 与 第 ; 个 样本 X; 之 间 的 距离 (i,j = 
1,…,n),G1,G2，…,G, 表示 类 , 巧 ,表示 类 G, 与 类 G, 之 间 的 距离 (p,q=1,…， 
n)。 下 面 以 5 个 随机 抽取 的 样本 为 例 ,说 明 系 统 聚 类 法 中 几 种 常用 的 方法 。 这 5 
个 样品 之 间 的 距离 矩阵 如 下 : 

G1 G2 G3 G4 Gs 


G1 0 
G2» 9 0 
De 13.29 
ee ( ) 
G1 |16 5 90 
Gs ll 10 2 8 0 


1. 最 短 距离 法 


最 短 距 离 法 定义 类 与 类 之 间 的 距离 为 两 类 中 最 近 样 品 的 距离 。 即 
Du = minld;y| (i€ G, jE€G, 当 p= 9 时 ,规定 Ds, = 0) 
(13.30) 
最 短 距离 法 的 并 类 原则 是 距离 最 近 的 两 类 进行 合并 。 应 注意 的 是 :如 果菜 步 
DD 中 最 小 的 非 零 元 素 不 止 一 个 , 则 对 应 于 这 些 最 小 的 元 素 的 类 可 以 同时 合并 。 据 
式 (13.29) 中 的 距离 矩阵 ,用 最 短 距 离 诊 类 法 进行 分 析 ,其 聚 类 过 程 如 下 : 
在 距离 矩阵 (13.29) 中 D3s = 2 a G3、Gs 合并 , 记 为 G6, 即 G6 = 
1G3,G5} ,分 别 按照 式 (13.30) 计 算 G6 与 G1、Gs、G4 之 间 的 距离 ,得 
G1! ‘G» G4 Gse 
G 0 
Gy 9 0 
G4 6 5 0 
G 3 7 8 0 
同 理 类 推 ,最 后 所 有 的 样品 均 被 归 为 一 类 。 
综合 上 述 聚 类 过 程 ,可 做 出 最 短 距离 聚 类 谱系 图 (图 13.2)。 
最 短 距 离 法 也 可 用 于 指标 (变量 ) 分 类 ,分 类 时 可 以 用 距离 ,也 可 以 用 相似 系 
数 。 但 用 相似 系数 时 应 找 最 大 的 元 素 并 类 , 即 是 把 式 (13.30) 中 的 min 换 成 max。 


2. 最 大 距离 法 
定义 类 与 类 之 间 的 距离 为 :两 类 中 最 远 样品 的 距离 。 即 
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GI G3 Gs G, Ga4 
图 13.2 最 短 距 离 罕 类 谱系 
Dy = max| d;| (GEG jE Gs, 当 p= 9 时 ,规定 Dp, = 0) 
(13.31) 
最 大 距离 法 与 最 短 趾 离 法 的 并 类 步骤 完全 一 样 ,也 是 将 各 样品 先 自 成 一 类 ,再 
将 非 对 角 线 上 最 小 元 素 对 应 的 两 类 合并 , 按照 距离 最 近 的 两 类 进行 合并 的 原则 依 
次 进行 归 类 ,不 同 的 是 采用 式 (13.31) 计 算 类 与 新 类 之 间 的 距离 。 
合并 的 过 程 这 里 不 再 蒙 述 ,只 把 并 类 的 顺序 列 于 表 13.3, 并 给 出 相应 的 谱系 
图 (图 13.3)。 
表 13.3 5 个 样品 点 最 大 距离 法 聚 类 顺序 























合并 次 序 合并 的 类 合并 后 类 中 的 元 素 合并 水 平 ( 距 离 ) 
1 Gs Gs Go= {G3,Gs| 2 
2 G2 Ga G7= {G2, G4 5 
3 G， G3 Gs= {G1,G2, G4 9 
4 Gs Gsg Go= 1G1,G2,G3,G4,Gs| 11 
12 Gy 
10 Gs 
8 
彼 6 G 
亲 4 7 
< Ge 
2 
6 上 
G@ G, G, G; G; 


图 13.3 ”最 大 距离 聚 类 谱系 
显然 ,最 短 距 离 聚 类 法 具有 空间 压缩 性 ,而 最 大 距离 法 具有 空间 扩张 性 。 
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3. 中 间距 离 法 


如 果 类 与 类 之 间 的 距离 采用 介 于 最 短 距 离 与 最 大 距离 之 间 的 距离 , 则 称 为 中 
间距 法 。 
设 类 G, 与 类 G, 合并 为 G,, 则 G, 与 任 一 类 Gi 的 中 间距 离 公式 为 
1 1 


1 
DY = TD% +iDh + pos(-1<8<o) We 


一 ~~ 


当 8= -地 时 ,由 初等 几何 知 Di 就 i je 
如 多 \ Re 

是 图 13.4 中 三 角形 的 中 线 ( 点 O 为 类 Go  & | Se 

与 类 Gy 连 线 的 中 点 )。 此 时 ,所 定义 的 类 . ,BN 


与 类 之 间 的 距离 称 为 中 线 法 。 即 AR 2 
1 1 1 
Di = FDiy + 7 Di -4D 图 13.4 ”中线 法 示意 图 
(13.33) 


用 中 线 法 对 式 (13.29) 进 行 聚 类 ,其 并 类 顺序 表 与 谱系 图 如 表 13.4 和 图 13.5 
所 示 。 


表 13.4 5 个 样品 点 中 线 法 聚 类 顺序 












合并 的 类 .合并 水 平 (距离 ) 





合并 后 类 中 的 元 素 
Ge= {G3, 
Ec EE 
Gg= {G1,G3,Gs} 
Go= {G1,G2,G3,G4,Gs} 


























10 Gs Gy 


G7 


锣 
EE 
亲 
4 


G) G3 Gs G, Ga 


图 13.5 ”中 线 法 聚 类 谱系 


4. 重心 法 
从 物理 的 观点 来 看 ,一 个 类 用 它 的 重心 (该 类 样品 的 均值 ) 做 代表 比较 合理 , 重 
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心 法 定义 两 类 之 间 的 距离 即 为 两 类 重心 之 间 的 距离 。 

设 类 G, 与 类 G, 分 别 有 样 品 几 ,7 个 ,其 重心 分 别 是 又, 和 叉 ,( 注 意 一 般 它 
们 是 卫 维 矢量 ), Gy 与 G, 之 间 的 距离 是 Dw = dxx 。 将 Gy 与 Gy 合并 为 G,, 则 
G; 内 样品 个 数 为 ,= np + mm ,其 重心 是 闷 = 一 (npXs + noXs), 某 一 类 Gi 的 重 
心 是 过 , 它 与 新 类 G, 的 距离 (如 果 最 初 样品 之 间 的 距离 采用 欧 氏 距离 ) 为 


npn 





n 机 
Di, = <pY, + —Dh, ~ SD», (13.34) 
ny ny 


显然 , 当 mw = ze 时 即 为 中 间距 离 法 的 公式 。 如 果 样 品 之 间 的 距离 不 是 殉 氏 
距离 ,可 根据 不 同情 况 给 出 不 同 的 距离 公式 。 重 心 法 与 上 述 方法 不 同 的 是 每 合并 
一 次 类 ,就 要 重新 计算 新 类 的 重心 及 各 类 与 新 类 的 距离 。 

用 重心 法 对 式 (13.29) 进 行 聚 类 ,其 并 类 顺序 表 与 谱系 图 如 表 13.5 和 图 13.6 


所 示 。 


表 13.5 5 个 样品 点 重心 法 聚 类 顺序 


cl Ce 


Gsg= {G1,G2,Gal 
Go= {G1,G2,G3,Ga, Gs 






合并 水 平 (距离 ) 




























图 13.6 重心 法 聚 类 谱系 


$. 类 平均 法 


重心 法 虽 有 很 好 的 代表 性 ,但 并 未 充分 利用 各 样品 的 信息 ,因此 给 出 类 平均 
法 , 它 定 义 两 类 之 间 的 距离 平方 为 这 两 类 元 素 两 两 之 间距 离 平方 的 平均 , 即 


1 
DE 六 (13.35) 
NphlaxEG, XEG, 


第 13 章 ”空间 数据 挖 振 算 法 . 291 : 


设 类 Gy 与 类 G, 合并 为 G,, 则 任 一 类 Gi 与 Cr 的 距离 为 
es 
MeN XEG XEG, 


a Dae 


MeN XEG XEG, XEG XEG, 








np n 
= nD + nD (13.36) 


用 类 平均 法 对 式 (13.29) 进 行 聚 类 ,其 并 类 顺序 表 与 谱系 图 如 表 13.6 和 
图 13.7 所 示 。 


表 13.6 5 个 样品 点 类 平均 法 聚 类 上 顺序 














合并 后 类 中 的 元 素 合并 水 平 ( 虐 离 ) 
| 一 
Ge= {G3,Gs| 2 





G7= {1G,, Gal 
Ggs= {G1,G3,Gsl 党 
Go= {G1,G2,G3,Ga4, Gs 


















乱 
拱 
亲 
4 





13.7 类 平均 法 聚 类 谱系 


6. 系统 聚 类 法 的 统一 公式 


除 上 述 5 种 方法 以 外 ,系统 聚 类 的 方法 还 有 很 多 ,公式 : 
D = asDY, + asDYs + BD + 7¥ | DY - DY | (13.37) 
就 是 表 13.7 中 8 种 不 同系 统 聚 类 方法 计算 类 之 间距 离 的 统一 表达 式 。 当 a、B、Y 
三 个 参数 取 不 同 的 值 时 ,就 形成 不 同 的 聚 类 方法 , 表 中 n, 是 p 类 中 单元 的 个 数 ， 
ng 是 9 类 中 单元 的 个 数 ,mw = ns + na;8 一 般 取 负 值 。8 种 递 推 公式 的 统一 表达 
给 编制 计算 机 程序 提供 了 极 大 的 方便 。 
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表 13.7 8 种 系统 聚 类 方法 的 距离 参数 






























































参数 
方法 名 称 一 一 一 | D 矩阵 要 求 | 空间 性 质 

| Qp aa | YY | 
最 短 虐 离 法 py 于 0 = 村 任意 D | 压缩 
最 大 降 离 法 六 二 0 任意 D 扩张 
下 半 于 i -地 <<B<0 | 0 | 欧 氏 虐 离 | 。 保持 

| 和 
、 np Ng -png 
生计 np+ ng np+ no (np+ ng)? " 全 人 
np np 

类 平均 法 0 0 | 在 意 D 保持 
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在 一 般 情 况 下 ,用 不 同 的 方法 聚 类 的 结果 是 不 会 完全 一 致 的 。 自 然 会 问 哪 一 
种 方法 好 呢 ? 这 就 需要 提出 一 个 标准 作为 衡量 的 依据 ,但 至 今 还 没有 一 个 合适 的 
标准 。 在 实际 应 用 中 ,一 般 采 用 以 下 两 种 处 理 方法 :一 种 办 法 是 根据 分 类 问题 本 身 
的 专业 知识 结合 实际 需要 来 选择 分 类 方法 ,并 确定 分 类 个 数 。 另 一 种 办 法 是 多 用 
几 种 分 类 方法 去 做 ,把 结果 中 的 共性 取出 来 , 如果 用 几 种 方法 的 某 些 结果 都 一 样 ， 
则 说 明 这 样 的 了 育 类 确实 反映 了 事物 的 本 质 , 而 将 有 争议 的 样品 暂 放 一 边 或 用 其 他 
办 法 如 判别 分 析 去 归 类 。 

从 纯 数学 的 意义 上 说 , 聚 类 分 析 要 求 各 变量 必须 相互 独立 , 互 不 相关 。 在 实际 
问题 中 ,多 个 变量 之 间 往 往 彼此 存在 着 不 同 程度 的 相关 关系 。 在 这 种 情况 下 ,用 欧 
氏 距 离 来 计算 样品 点 群 的 空间 距离 ,就 会 使 空间 中 样品 的 距离 发 生 了 畸变, 从 而 使 点 
群 艇 分 时 谱系 的 分 群 结构 发 生变 化 。 为 避免 这 种 现象 ,一般 采用 两 种 途径 处 理 , 一 
是 先 对 原始 变量 作 主 成 分 分 析 ,将 相关 变量 综合 成 主 成 分 ,再 进行 聚 类 分 析 ; 或 用 
斜 交 距离 系数 代替 欧 氏 距离 系数 。 


13.6.5 其 他 聚 类 方法 概述 


聚 类 分 析 的 内 容 是 很 丰富 的 ,本 节 主 要 介绍 了 国内 外 常用 的 8 种 系统 聚 类 法 。 
除 此 之 外 ,还 有 有 序 样品 聚 类 法 模糊 聚 类 法 、 动 态 聚 类 法 、 分 解法 ,加 和 人 法 等 。 
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1. 有 序 样品 聚 类 法 


系统 聚 类 法 要 求 被 分 类 的 样品 是 相互 独立 的 ,分 类 时 彼此 是 平等 的 。 而 有 序 
样品 分 类 法 要 求 样品 按 一 定 的 顺序 排列 ,分 类 时 不 能 打 乱 次 序 。 研 究 这 类 样品 的 
分 类 问题 就 用 有 序 样品 聚 类 法 。 有 序 样品 的 分 类 实质 上 是 找 一 些 分 点 ,将 有 序 样 
品 划分 为 几 个 分 段 ,每 个 分 段 看 作 一 个 类 ,所 以 分 类 也 称 为 分 割 。 显 然 ,分 点 取 在 
不 同 的 位 置 就 可 以 得 到 不 同 的 分 割 。 通 常 寻找 最 好 分 割 的 一 个 依据 就 是 使 各 段 内 
部 样品 之 间 的 差异 最 小 ,而 各 段 样品 之 间 的 差异 较 大 。 有 序 样品 聚 类 法 就 是 研究 
这 种 最 优 分 割 法 。 


2. 模糊 聚 类 法 


模糊 聚 类 法 是 将 模糊 集 的 概念 用 到 聚 类 分 析 中 所 产生 的 一 种 聚 类 方法 。 它 是 
根据 研究 对 象 本 身 的 属性 而 构造 一 个 模糊 矩阵 ,在 此 基础 上 根据 一 定 的 隶属 度 来 
确定 其 分 类 关系 。 模 糊 聚 类 分 析 能 更 客观 地 描述 具有 不 分 明 性 的 对 象 ,从 而 使 实 
际 的 聚 类 结果 更 加 合理 。 尤 其 是 在 经 典 的 聚 类 分 析 遇 到 障碍 的 场合 ,模糊 聚 类 分 
析 显 示 了 它 独特 的 技巧 。 


3. 动态 聚 类 法 


开始 将 ”个 样品 粗糙 地 分 成 指定 的 若干 类 ,然后 确定 一 定 的 最 优 准 则 ,再 用 
最 优 准 则 进行 调整 多 次 ,一 次 比 一 次 接近 最 优 , 直至 不 能 调整 为 止 。 


4. 分 解法 


将 所 有 样品 先 放 在 同一 类 ,然后 用 一 定 的 最 优 准 则 将 其 分 成 两 类 。 再 用 同样 
的 最 优 准 则 将 这 两 类 各 自分 成 两 类 ,并 从 中 选 出 使 目标 函数 最 好 者 。 如 此 继续 分 
类 ,直到 每 类 中 只 有 一 个 样品 。 上 述 分 类 过 程 可 画 成 相应 的 分 类 图 ,从 图 中 可 求 出 
需要 的 类 及 每 类 的 样品 。 


5. 加 入 法 
将 样品 逐个 依次 序 输 入 ,每 次 输入 的 样品 相应 地 归 人 当前 聚 类 图 中 应 有 的 位 
置 ,样品 全 部 输入 后 , 即 得 到 聚 类 图 。 


13.7 判别 分 析 


判别 分 析 是 判别 样品 所 属 类 型 的 一 种 统计 方法 。 它 与 聚 类 分 析 的 不 同 之 处 在 
于 ,判别 分 析 是 在 已 知 研究 对 象 分 成 若干 类 型 (或 组 别 ), 并 已 取得 各 种 类 型 的 一 批 
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已 知 样品 的 观测 数据 。 在 此 基础 上 根据 某 些 准则 建立 判别 式 ,然后 对 未 知 类 型 的 
样品 进行 判别 分 类 。 对 于 聚 类 分 析 来 说 ,一 批 给 定 样品 要 划分 的 类 型 事先 并 不 知 
道 , 正 需 要 通过 聚 类 分 析 来 确定 类 型 。 正 因为 如 此 ,判别 分 析 和 聚 类 分 析 往 往 联 合 
起 来 使 用 ,例如 判别 分 析 是 要 求 先知 道 各 类 总 体 情 况 才 能 判断 新 样品 的 归 类 。 当 
总 体 分 类 不 清楚 时 ,可 先 用 聚 类 分 析 对 原来 的 一 批 样 品 进行 分 类 ,然后 再 用 判别 分 
析 建 立 判 别 式 以 对 新 样品 进行 判别 。 

判别 分 析 按 已 知 类 别 的 数目 ,可 以 分 为 两 类 判别 和 多 类 判别 ; 按 建 立 判别 函数 
时 所 用 的 准则 分 类 ,有 费 软 (Fisher) 准 则 下 的 判别 分 析 和 贝 叶 斯 (Bayes) 准 则 下 的 
判别 分 析 等 ; 按 区 分 不 同 母体 所 用 的 数学 模型 ,分 为 线性 判别 和 非 线性 判别 。 

判别 分 析 具 有 如 下 特点 ; 

(1) 必须 有 已 知 类 型 的 样本 作为 "训练 组 ”, 这 是 与 聚 类 分 析 最 重要 的 差别 ; 

(2) 已 知 类 别 之 间 的 分 布 一 般 有 相互 重合 的 部 分 ,因此 有 一 部 分 个 体 在 划分 
类 别 时 ,可 能 出 现 错 划 现象 ; 

(3) 判别 分 析 将 一 个 多 维 的 矢量 空间 (多 种 特征 ) 约 简 为 一 维 的 判别 空间 ,从 
而 大 大 简化 了 空间 维 数 ,而 不 致 损失 划分 不 同 总 体 的 更 多 信息 ; 

(4) 根据 中 心 极限 定理 ,多 个 变量 的 线性 函数 比 单 变量 有 较 大 可 能 服从 正 态 
分 布 规律 ,因而 判别 函数 比 原始 变量 能 更 好 地 满足 多 元 正 态 分 布 这 一 重要 假设 。 

本 节 主 要 介绍 常用 的 距离 判别 、Fisher 判别 和 Bayes 判别 方法 ,最 后 对 判别 分 
析 中 应 注意 的 问题 进行 简要 说 明 。 


13.7.1 距离 判别 


基本 思想 :首先 ,根据 已 知 分 类 的 数据 ,分 别 计 算 各 类 的 重心 即 分 组 (类 ) 的 均 
值 ;然后 ,给 出 一 个 样品 到 菜 个 总 体 距离 的 定义 ;最 后 ,根据 样品 到 哪个 总 体 的 距离 
最 近 , 就 判断 该 样品 归属 于 此 类 。 

距离 判别 法 对 各 类 (或 总 体 ) 的 分 布 ,并 无 特定 的 要 求 。 


1. 两 个 总 体 的 距离 判别 法 


设 有 两 个 总 体 G1、G;, 从 第 一 个 总 体 中 抽取 ni 个 样品 ,从 第 二 个 总 体 中 抽取 
nz 个 样品 ,每 个 样品 有 p 个 测量 值 。 对 于 给 定 的 一 个 样品 义 = (zi, zx2,… ,Xp)， 
判断 X 的 种 类 归属 。 

首先 计算 XX 到 G1、Gs 总 体 的 距离 ,分 别 记 为 D(X,G1) 和 D(X,G2), 按 距离 
最 近 准则 判别 归 类 , 则 有 

位 € G1, 当 D(X,Gi)< D(X, G2) 


13.38 
XEG,,D(X,G1)> D(X,G,) ( ) 
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记 均 值 矢量 Ki= (Zi i=1,2 
(1) 如 果 距 离 定义 采 用 欧 氏 距离 , 则 


D(X,G1)= (X -RX)(X -RY) = > (Be 


D(X,G2)=Y (XX) (X- ER) = > (Br 
比较 D(XX, G1) 和 D(XX, Gz ) 大 小 , 按 距 离 最 近 准 则 判别 归 类 。 
(2) 如 果 距 离 定 义 采用 马 氏 距离 , 则 
D(X,Gi)= (X- pus) (Vi) (X -pi), i= 1,2 

式 中 ,yi、p2, Vi、V2 分 别 为 G1、G 的 均值 矢量 和 协 方差 阵 。 此 时 ,判别 准则 为 

第 一 , 当 Vj=V,=V>0 时 

为 便于 应 用 ,可 以 求 出 线性 判别 函数 ,为 此 考察 X 到 Gi、G, 的 马 氏 距离 的 平 
方 之 差 : 





， 
D(X,G2) -D(X,G1) -2 人 (X- 人 和 ja) 


令 凤 = 一 一 一 ,1(CX)=(X-A) VIAa) 


则 判别 规则 又 可 写 为 民 EG1, W(X)>0 
XEG;, 当 W(X)<O 


当 pipzV 都 已 知 时 , 令 a=V-1(p1 一 2), 则 a 为 一 已 知 的 p 维 矢量 ,此 


— _ KI1+ A2 
A 


时 
W(X)=(X-A)a=a (X-&) 
式 中 ,为 X 的 线性 判别 函数 ;a 称 为 判别 系数 ,可 以 由 方程 组 Va = ju - ma 求 得 。 
于 是 判别 规则 为 
XEGi,a (X-u)20 
1 (13.39) 


XEG, 当 ai(X-A)<0 
当 jy、p2,V 都 未 知 时 , 先 求 出 相应 的 估计 值 wj 、y2、VY ,再 代 人 线性 判别 函数 


W(X) 中 ,估计 值 的 求法 如 下 : 
从 G1 中 抽取 容量 为 n1 的 样本 X; 从 Gz 中 抽取 容量 为 n; 的 样本 了 , 取 
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1 nl Ey 1 nl ， 
式 中 , S1 = 一 一 2 (XX)(X; -XX) ,Ss = 一 一 2 (Y,-Y)(Y,-Y) 
1 一 上 n2 11 


于 是 线性 判别 函数 为 W(X) =& (XX 一 庆 ), 判 别 系数 为 和 = 久 -1(1 -2 ) ,判别 规 
则 同样 采用 式 (13.39), 其 中 o'(X- 却 ) 用 2 (X- 却 ) 代 替 。 
第 二 , 当 G1、G2 的 协 方差 ViV.>0 时 
车 yi wz、Vi、Vi 均 已 知 ,可 直接 采用 马 氏 距离 公式 进行 判别 ,判别 规则 用 式 
(13.38) ,其 中 
ad(X,G)= [Xp) VIX- pn) J 
d(X,G2) =[(X-p2) VIX- po) 
车 yz、Vi、V2 均 未 知 ,从 两 总 体 中 抽取 样本 , 求 出 相应 估计 值 。 
由 此 可 计算 出 
d(X,G1)=[ (XP) Vr XA 
alXI GT(X -h(a)]2 
再 用 判别 准则 式 (13.38) 对 X 的 归属 进行 判别 。 
2. 多 个 总 体 的 判别 问题 


设 有 个 p 维 总 体 Gi,…, Gi, 其 均值 矢量 分 别 为 i，,… ,yi , 协 方差 阵 分 别 为 
Vi>0,…, >0, 对 于 给 定 样品 X 判断 其 类 型 归属 。 


同样 分 两 种 情况 讨论 : 
1) 若 Vi="…= Vi= VvV>0 


(1) 当 jp,… ,pi4，;V 均 已 知 时 ,XX 的 线性 判别 函数 为 
Wi(X)=a; (X -Zi) i,j=1,.,k;iAj 


式 中 ， 
ay= V (pi™ 4s) 
二 
则 其 判别 规则 为 


(2) 当 pi1,…, pi;V 均 未 知 时 , 先 从 个 总 体 中 分 别 抽取 样本 XD ，… ,X22); 
X 和 9 ，…,X 罗 ，n 一 了 i， 则 Wy(X) 中 的 参数 用 如 下 估计 值 代替 : 
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1 a i 
式 中 ， 人 2 (XR (CX =) ,i,j 一 1 ss 1 天 
i j=1 


于 是 ,线性 判别 函数 为 Wj(X)=& (XX-),i,j=1,…,k;ij 
其 中 判别 系数 为 ar = 六 -1(Hi 一 所 ) ,判别 规则 仍 用 式 (13.41)。 
2) 若 Vs 不 全 相同 
(1) 当 Ap Vi,…, 均 已 知 时 ,分 别 计算 X 到 & 个 总 体 的 马 氏 距离 
eal CX i 
则 判别 规则 为 : 
当 d(X,Gi)< mind (X,G;) 时 ,X EG, (i = 1,.…,k) (13.42) 
(2) 当 jp,… ,py4; Vi,…, Vi 均 未 知 时 , 先 从 这 个 总 体 中 分 别 抽取 样本 , 求 


它们 的 相应 估计 值 ,再 算出 X 到 各 总 体 的 马 氏 距离 ,其 判别 规则 仍 为 式 
42)。 


13.7.2 费 歇 判 别 法 


费 软 (Fisher) 判 别 是 英国 数学 家 费 软 (R. A. Fisher) 于 1936 年 提出 来 的 ,该 法 
对 总 体 的 分 布 并 未 提出 什么 特定 的 要 求 。 


1. Fisher 判别 法 的 基本 思想 


Fisher 准则 :通过 坐标 原点 在 某 两 个 点 群 之 间 寻 找 一 个 最 优 分 割 面 (其 数学 表 
达 式 就 是 判别 函数 ) ,使 得 这 两 个 总 体 的 样品 点 在 该 分 割 面 上 的 投影 达到 最 大 限度 
的 分 离 , 而 且 满 足 类 间距 高 最 大 ,而 类 内 离 差 最 小 的 准则 。 将 Fisher 准则 引入 判别 
分 析 则 可 得 到 Fisher 判别 法 。 

设 有 个 p 维 总 体 G1,…, Gi, 从 这 此 个 总 体 中 分 别 抽取 具有 个 指标 的 样 
品 观测 值 ,借助 上 述 思想 构造 一 个 线性 判别 函数 (判别 式 ): y= cizxi+ czzrz 十 … 十 
cpzp ,其 中 系数 c1,c2，,… ,cp 确定 的 原则 是 使 两 组 间 的 区 别 最 大 ,而 使 每 个 组 内 部 
的 离 差 最 小 。 判 别 式 确定 后 ,对 于 一 个 新 的 样品 ,将 它 的 p 个 指标 值 代入 判别 式 
中 求 出 y 值 ,然后 与 判别 临界 值 (或 称 分 界 点 ) 进 行 比较 ,就 可 以 判别 它 应 属于 哪 一 
个 总 体 。 


以 二 维 总 体 G1、G; 为 例 ,如 图 13.8 所 示 和 拖 形 点 为 G1 的 点 , 圆 点 为 G2 的 点 ， 
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图 13.8 Fisher 判别 法 原理 


假定 所 建立 的 判别 函数 为 


y(Z)=clzl 


式 中 ,ec= (cly* ,cp) ,z= (zi 


它们 分 别 在 x1 和 zz 轴 上 的 投影 有 很 大 
一 部 分 重合 在 一 起 ,因此 要 用 原 变量 zi 
和 zz 的 取 值 范围 把 G1、G, 分 开 是 困难 
的 。Fisher 判别 等 于 要 在 三 维 空间 找到 
一 个 平面 (对 于 多 维 总 体 , 需 找到 若干 个 
平面 ) 将 G1、G; 两 个 点 集 分 割 开 。 


2. 判别 函数 的 建立 


设 有 个 p TO ', Gi, 抽取 
样品 数 分 别 为 n1,…,ni, 令 n= ni+n2 
+ ps ee ,0 ) 为 第 i 


个 总 体 的 第 a 个 样品 的 观测 矢量 。 


i cprpc x 


记 z 中 和 s(? 分 别 是 总 体 G; 内 zz 的 样本 均值 矢量 和 样本 协 差 阵 ,根据 求 随机 
变量 线性 组 合 的 均值 和 方差 的 性 质 可 知 , y(z) 在 G; 上 的 样本 均值 和 样本 方差 为 


3 中 =e 入 


记 Zz 为 总 的 均值 矢量 , 则 y= CTo 


og?= este 


Fisher 准则 就 是 要 选取 系数 矢量 ,使 


p= 


大 
Dn; (yy — y)? 
i=1 





> ar 


达到 最 大 ,其 中 g; 是 人 为 的 正 的 加 权 系数 , 它 可 以 取 为 先 验 概率 。 如 果 取 。 - 
2 一 1, 出 =， 式 中 , 玉 为 组 内 离 差 阵 ; A 为 总 体 之 间 样 本 协 差 阵 , 即 





为 求 4 的 最 大 值 ,根据 极 值 存在 的 必要 条 件 , 令 人 了 0 , 则 
aA 2Ac 2 让 


aC cEc cEc 
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因此 5 =0~>Ac= AhEc, 这 说 明 及 c 恰好 是 A 、E 矩阵 的 广义 特征 根 及 其 对 
应 的 特征 矢量 。 由 于 一 般 都 要 求 加 权 协 差 阵 E 是 正定 的 ,因此 上 式 非 零 特征 根 个 
数 mm 不 超过 min(& 一 1, 力 ) ,又 因为 A 为 非 负 定 的 ,所 以 非 零 特征 根 必 为 正 , 记 为 
XA1 宇 42 之 … 之 Xm >0, 于 是 可 构造 m 个 判别 函数 : 
yz) = eVz, 1 = 1,…,m (13.43) 
对 于 每 个 判别 函数 必须 给 出 一 个 用 以 衡量 判别 能 力 的 指标 , mo 个 判别 函数 
yo 的 判别 能 力 定义 为 





mo 
和 1 

spm S27 pr = 
A 


如 果 spw 达到 某 个 人 定 的 值 (比如 85% ) 则 就 认为 mo 个 判别 函数 就 够 了 。 
3. 多 总 体 Fisher 判别 法 


有 了 判别 函数 之 后 ,如 何 对 待 判 的 样品 进行 分 类 ? Fisher 判别 法 本 身 并 未 给 
出 最 合适 的 分 类 法 。 在 实际 工作 中 可 以 选用 下 列 分 类 法 之 一 去 作 分 类 。 


1) 当 xzo= 工 时 ( 即 只 取 一 个 判别 函数 ) 


(1) 不 加 权 法 
若 |y(z) 一 y| = mig,|y(z) 一 y 四 | , 则 判 zxE G;。 
(2) 加 权 法 


将 3 ,…,3 按 大 小 次 序 排列 , 记 为 yo 三 … 志 yc), 相应 判别 函数 的 标准 
差 重 排 为 O(i)o 令 
4 sD to 
Fk 
Oo(i+1) + Gi) 
则 di,i+1 可 作为 Gi 与 Gi+1 之 间 的 分 界 点 , 若 d;_1; 守 y(X) 二 di;,;-_1; 则 判 zE 
Gio 


t= "kl 


(1) 不 加 权 法 
记 yD =ecDz >, [=1,.…,mo;i=1,.…,k 


对 待 判 样品 z= (Xx1,° . a) ,计算 


a 
Ws Dl= ln) HP, lk 
7=1 





车 D3= minDi, 则 判 z€ Cv。 
(2) 加 权 法 
考虑 到 每 个 判别 函数 的 判别 能 力 不 同 , 记 


To 


D? = 2 [yz) — ya 
. i=1 
式 中 ,为 由 Ac = AEc 求 出 的 特征 根 。 若 Dy= migDi, 则 判 XE Gyo 


13.7.3 贝 叶 斯 判别 法 


如果 对 多 个 总 体 的 判别 考虑 的 不 是 建立 判别 式 , 而 是 计算 新 给 样品 属于 各 总 
体 的 条 件 概率 P(1/z),7=1,…,k。 比 较 这 个 概率 的 大 小 ,然后 将 新 样品 判 归 
为 来 自 概率 最 大 的 总 体 ,这 种 判别 法 称 为 贝 叶 斯 (Bayes) 判 别 法 。 费 吹 准 则 是 为 p 
维 空间 两 个 点 群 寻找 最 优 分 割 面 ,而 贝 叶 斯 准则 是 为 p 维 空间 G 个 点 群 寻找 最 优 
空间 划分 方法 。 


1. 基本 思想 


设 有 个 p 维 总 体 G1, Gs,…, G4, 若 从 中 取得 ”个 样品 ,每 个 样品 必然 属于 
这 G 个 总 体 中 的 某 一 个 ,如 果 将 每 个 样品 看 作 p 维 空间 中 的 一 个 点 , 则 ”个 样品 
组 成 一 个 p 维 样本 空间 。 如 果 设 法 将 样品 空间 划分 为 G 个 两 两 互 斥 的 子 空间 ,并 
分 别 与 G 个 总 体 相对 应 。 则 对 于 一 个 未 知 样品 z( zi, x2,…, zp) 也 可 看 作 p 维 
空间 中 的 一 个 点 ,看 它 落 在 哪个 子 空间 的 概率 最 大 ,就 把 它 划 归 那个 总 体 。 

Bayes 判别 法 总 是 假定 对 所 研究 的 对 象 已 经 有 一 定 的 认识 ,并 常用 先 验 概率 
来 描述 这 种 认识 , 记 个 总 体 的 先 验 概率 分 别 为 g1,g,,…, gs( 它 们 可 以 由 经 验 给 
出 也 可 以 估 出 )。 各 总 体 的 密度 函数 分 别 为 : (zx), f(x),…, fi(z)( 在 离散 情 
形 是 概率 函数 ) ,对 于 观测 到 的 一 个 样品 X, 可 用 Bayes 公式 计算 它 来 自 第 g 个 总 
体 的 后 验 概率 P。 

(BY = g = 1,.…,k (13.44) 
2 gfi(z) 

且 当 P(h/z)= magP(g/zx) 时 , 则 判 X 来 自 第 总 体 。 

有 时 还 可 以 用 错 判 损失 最 小 的 概念 作 判 决 函数 ,此 时 把 X 错 判 为 第 总 体 的 
平均 损失 定义 为 





E(h/x) = >) gefe (7) ‘L(h/g) (13.45) 
kh 2 
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式 中 ,L(h/g) 称 为 损失 函数 。 它 表示 本 来 是 第 g 总 体 的 样品 错 判 为 第 hk 总体 的 
损失 。 当 有 =g 时 ,有 L(h/g)=0; 当 hh 关 g 时 ,有 上 L(h/g)>>0。 建 立 判 别 准则 
为 :如 果 E(h/z) = migE(g/7t) , 则 判定 X 来 自 第 hh 总 体 。 

原则 上 说 ,考虑 损失 函数 更 为 合理 ,但 是 在 实际 应 用 中 L (4h/g) 不 容易 确定 ， 
因此 往往 在 数学 模型 中 就 假设 各 种 错 判 的 损失 丝 相 等 , 即 L(h/g)=1,( 当 及 关 
g)。 此 时 ,寻找 h 使 后 验 概率 最 大 和 使 错 判 的 平均 损失 最 小 是 等 价 的 。 


2. 多 元 正 态 总 体 的 Bayes 判别 法 


在 实际 问题 中 遇 到 的 许多 总 体 往往 服从 正 态 分 布 ,以 下 给 出 p 元 正 态 总 体 的 
Bayes 判别 法 。 


1) 判 列 函数 的 建立 
先 验 概率 的 确定 :对 于 先 验 概率 ,如 果 没 有 更 好 的 方法 ,可 用 样品 频率 代替 , 即 
令 @= 至, 其 中 ns 为 已 知 分 类 数据 中 来 自 第 g 总 体 样品 的 数目 ,县 mi + x2+… 
+ m=n; 或 者 令 先 验 概率 相等 , 即 g = 二 ,此 时 可 以 认为 先 验 概率 不 起 作用 。 
元 正 态 分 布 密度 函数 为 
fez) = (21722 DON exp| -二 -py DD Cx p00) 
(13.46) 


式 中 ,we 和 > '* 分 别 为 第 g 总 体 的 均值 矢量 (p 维 ) 和 协 差 阵 (p 阶 )。 
因为 P(g/z) 分 式 中 的 分 母 无 论 g 为 何 值 都 是 常数 , 故 寻求 使 P(g/z) 最 大 


的 g, 等 价 于 ge 万 (z) 一 max。 
将 f(z) 代 入 上 式 , 并 取 对 数 , 记 


1 1 ， 呈 
QCgLzr) Ingg 人 pi pL | i 本 3 过 
3 8) 十 和 8) 
则 问题 转化 为 Z(g/z )—£>max。 
2) 假设 协 方差 阵 相 等 


即 Se 本 De ts 由 So 本 3 
这 时 Z(g/z) 中 的 二 mn| 习 人 | 和 了 zx 可 x 两 项 与 g 无 关 , 求 最 大 时 可 


. 302 . 地 理 信 息 系 统 算 法 基础 


以 去 掉 ,最 终 得 到 如 下 形式 的 判别 函数 与 判别 准则 (如 果 协 方差 阵 不 等 , 则 有 非 线 
性 判别 函数 ): 


1 “Sm- sm-1 
1 = DA i 


y(g/zx) > max 


13.7.4 判别 分 析 应 注意 的 问题 
1. 指标 的 选择 


一 般 来 讲 , 指 标 选择 的 好 坏 直接 影响 判别 的 效果 ,如 果 在 某 个 判别 问题 中 ,将 
其 中 最 主要 的 指标 (变量 ) 忽 略 了 ,那么 由 此 建立 的 判别 函数 其 效果 一 定 不 好 。 但 
在 许多 问题 中 ,往往 事先 并 不 十 分 清楚 哪些 指标 是 主要 的 ,这 时 是 否 将 有 关 的 指标 
尽量 都 收集 进来 加 入 计算 才 好 呢 ? 理论 和 实践 证 明 , 指 标 太 多 了 ,不仅 计 算 量 太 
大 ,而 且 许多 对 判别 无 作用 的 指标 反而 会 干扰 我 们 的 视线 ,因此 适当 筛选 变量 的 问 
题 是 一 件 很 要 紧 的 事 ,而 逐步 判别 法 正好 解决 了 此 问题 ,有 兴趣 的 读者 可 参考 有 关 
专著 。 


2. 判别 函数 中 分 界 点 yo 的 选取 


分 界 点 的 选取 对 判别 效果 的 影响 还 是 很 大 的 ,如 果 选 取 不 当 , 很 可 能 使 一 个 好 
的 判别 函数 变 得 毫 无 分 类 的 价值 。 对 分 界 点 的 取 法 可 以 有 各 种 不 同 的 出 发 点 ,如 
可 以 人 为 地 从 经 验 或 问题 的 实际 背景 出 发 指定 yo 值 ;或 把 ai; + zz 个 y(z) 值 从 
小 到 大 排列 ,适当 地 取 其 中 一 点 作 分 界 点 yo3; 或 可 以 取 一 个 区 间 ,然后 规定 相应 的 
判别 规则 ;如 果 想 从 数学 上 讨论 ,还 有 平均 错 判 率 最 小 法 。 这 些 都 是 从 不 同 出 发 点 
确定 分 界 点 的 方法 。 


3. 判别 法 则 的 评价 


无 论 采 用 哪 种 判别 方法 ,一般 总 会 发 生 错 判 ,这 就 是 作 判 决 所 要 承担 的 风险 。 
目前 已 研究 出 很 多 种 估计 错 判 概率 的 方法 。 中 用 建立 判别 函数 的 训练 样品 进行 回 
代 , 用 错 判 的 样品 数 比 上 全 体 样品 数 作为 错 判 概率 的 估计 。 但 是 经 验证 明 ,该 方法 
估计 错 判 概率 往往 偏 低 。@ 一 种 改进 的 方法 是 将 参加 类 别 的 样品 分 成 两 部 分 ,用 
其 中 一 大 部 分 样品 (例如 85% ) 的 观测 数据 去 建立 判别 函数 和 判别 准则 ,用 剩余 的 
一 小 部 分 样品 (例如 15% ) 的 观测 数据 进行 判断 。 将 错 判 的 比例 作为 错 判 概率 的 
估计 。 其 优点 是 容易 计算 ,又 不 要 求 已 知 总 体 的 分 布 及 判别 函数 的 分 布 ;缺点 是 在 
建立 判别 函数 时 ,未 能 充分 利用 全 部 样品 的 信息 , 且 样 品 量 较 大 。 如 一刀切 法 从 总 
体 G1\G2 中 分 别 取出 n\n2 个 样品 , 令 nit nn ,并 对 这 n 个 样品 依次 进行 编 
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号 。 先 去 掉 1 号 样品 ,用 其 余 的 2- 工 个 样品 建立 判别 函数 和 判别 准则 ,然后 将 该 
样品 的 观测 数据 代入 ,看 它 被 判 归 为 哪个 总 体 ,如 果 错 判 则 记录 下 来 ,再 将 该 样品 
放 回 ;再 去 掉 2 号 样品 ,用 其 余 n 一 1 个 样品 建立 判别 函数 和 判别 准则 ……, 以 此 
` 类 推 ,一 直 做 完 n 步 。 分 别 计算 总 体 ,G1、G2 中 样品 被 错 判 的 个 数 ,并 除 以 相应 的 
总 样品 个 数 ( 即 n1、n2) ,从 而 得 出 各 自 错 判 概率 的 估计 值 。 


13.8 主 成 分 分 析 


在 实际 研究 中 ,为 了 对 问题 做 出 全 面 .可靠 的 分 析 , 往 往 会 提出 很 多 与 此 有 关 
的 变量 (或 因素 ) ,这 些 变量 都 在 不 同 程度 上 反映 了 该 研究 的 某 些 信息 。 一 般 来 讲 ， 
变量 越 多 所 获得 的 信息 越 充分 。 然 而 , 太 多 的 变量 不 可 避免 地 会 增加 对 问题 分 析 
的 复杂 性 ,而 且 在 很 多 情况 下 ,变量 之 间 是 有 一 定 相关 关系 的 , 即 反 映 该 研究 的 信 
息 有 一 定 的 重要 。 人 们 自然 希望 变量 个 数 较 少 而 得 到 的 信息 较 多 ,本 节 所 介绍 的 
主 成 分 分 析 法 就 是 处 理 这 类 问题 的 一 种 强 有 力 的 方法 。 主 成 分 分 析 首 先是 由 K. 
皮尔 森 对 非 随机 变量 引入 的 ,尔后 H. 霍 特 林 将 此 方法 推广 到 随机 矢量 的 情形 。 


13.8.1 主 成 分 分 析 的 基本 原理 


主 成 分 分 析 (principle component analysis, PCA) 是 在 尽量 不 丢失 信息 的 前 提 
下 ,把 原来 多 个 指标 化 为 少数 几 个 综合 指标 , 且 这 些 综合 指标 之 间 互 不 相关 的 一 种 
统计 分 析 方 法 。 
设 X=(zi,…，,zp) 是 p 维 随机 变量 ,如 何 将 这 p 个 指标 综合 成 尽 可 能 少 的 
几 个 综合 指标 , 既 能 充分 反映 原 有 指标 所 反映 的 信息 ,又 保证 它们 之 间 彼 此 独立 。 
解决 这 一 问题 最 简单 的 方法 就 是 取 原 来 变量 指标 的 线性 组 合 ,适当 调整 组 合 系数 ， 
使 新 的 变量 指标 之 间 互 相 独 立 且 代表 性 最 好 , 记 新 变量 指标 为 yi,y2,，… ,ym(m 碾 
p)。 则 
y1 三 QHZ1I 十 十 Qlpp 
32 三 Q21ZI 士 "十 daprp 


Booeeooeoreeere reer er raeeee 


(13.48) 


Bn tt ee 
式 中 ,系数 a; 为 非 零 的 常数 ;i、j 、m 、p 均 为 正 整 数 ,i€E[1,m],j€l1,p]1。 
信息 的 大 小 通常 用 离 差 平方 和 或 方差 来 衡量 。 若 使 新 变量 指标 能 最 大 限度 地 
反映 原 有 指标 的 作用 ,就 应 使 原来 的 p 个 指标 经 过 式 (13.48) 变 换 后 ,得 到 的 y 具 
有 尽 可 能 大 的 方差 ,这 就 是 求 主 成 分 的 基本 思想 。 因 此 ,系数 a; 由 下 列 原则 决定 : 
(1) y 是 zi1,x2，… ,zp 的 一 切线 性 组 合 中 方差 最 大 者 ; ys 是 与 yi 不 相关 的 
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Zz1,2Z2， yzZp 的 所 有 线性 组 合 中 方差 最 大 者 ;……; y。, 是 与 y1,y2，…, ym -1 都 不 
相关 的 zi1 ,zx2,…, xp 的 所 有 线性 组 合 中 方差 最 大 者 。 

这 样 新 变量 指标 y1 、y2，… ,ym 分 别称 为 原 变量 指标 zl, zz，…,zs 的 第 一 ,第 
二 ,…, 第 m 主 成 分 。 其 中 , yi 在 总 方差 中 占 的 比例 最 大 ,y，… yw 的 方差 依次 
递减 。 在 实际 问题 的 分 析 中 , 常 选取 前 几 个 最 大 的 主 成 分 ,这 样 既 减少 了 变量 的 数 
目 ,又 能 抓 住 主要 矛盾 ,简化 了 变量 之 间 的 关系 。 从 数学 上 容易 得 知 ,系数 a; 分 别 
是 X 的 协 方差 矩阵 Y 前 xm 个 较 大 的 特征 根 所 对 应 的 特征 矢量 。 

(2) 新 变量 指标 ( 主 成 分 )y1、y2，,… ,ym 互 不 相关 。 

由 于 协 方差 是 对 称 阵 ,根据 矩阵 代数 知 , V 的 不 同 的 特征 根 所 对 应 的 特征 矢 
量 是 正 交 的 。 所 以 ,如 果 求 得 的 mx 个 特征 根 全 不 相同 时 , 则 所 对 应 的 特征 矢量 是 
互相 正 交 的 ,这 表明 所 求 得 的 主 成 分 y1、y2，… ,Ya 之 间 互 不 相关 。 

主 成 分 分 析 的 原理 可 如 图 13.9 所 示 。 假 设 原始 数据 为 二 维 数据 ,两 个 分 量 
Z1、\Z2 之 间 存 在 相关 性 ,通过 投影 ,各 数据 可 以 表示 为 yi 轴 上 的 一 维 点 数据 ,从 二 
维 空间 中 的 数据 变 成 一 维 空间 中 的 数据 会 产生 信息 损失 ,为 了 使 信息 损失 最 小 , 必 
须 按照 使 一 维 数据 的 信息 量 ( 方 差 ) 最 大 的 原则 确定 yi 轴 的 取向 ,新 轴 y 称 作 第 
一 主 成 分 。 为 了 进一步 汇集 剩余 的 信息 ,可 求 出 与 第 一 轴 yi 正 交 , 且 尽 可 能 多 地 
汇集 剩余 信息 第 二 轴 y,, 新 轴 yz 称 作 第 二 主 成 分 。 






(第 一 主 成 分 ) 


Xl 


图 13.9 主 成 分 分 析 原 理 


13.8.2 主 成 分 分 析 的 方法 


主 成 分 分 析 的 算法 可 总 结 如 下 : 设 有 矢量 集 X= {Xi,i=1,2,…,NIE R"”，, 
E(X) 为 X 的 数学 期 望 ,A 是 X 的 协 方差 矩阵 Y 的 特征 矢量 按 其 特征 根 由 大 到 小 
的 顺序 排列 而 构成 的 变换 矩阵 , 则 称 

Y; = AX: (13.49) 


和 
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XA (13.50) 


为 主 成 分 分 析 算 法 ,其 中 ,Y= | Yi,i=1,2,…, NIE R”。 
主 成 分 分 析 的 方法 和 步骤 可 概括 如 下 : 
1. 主 成 分 的 求 取 
1) 从 协 方 差 矩 阵 出 发 
(1) 计算 协 方差 矩阵 V 
cov(Z1,Z1) … cov(z1, zp) 
V = : (13.51) 
Cov( zp ,x1) 5 cov(CZp ，Zp) 
式 中 ,cov(xzi ,Zz ) 为 原来 变量 zx; 与 xz 的 协 方差 ,计算 公式 为 
cov( zi, TX; ) 二 2 二 Zi) (Th TA Z;) (13.52) 


(2) 计算 特征 值 与 特征 矢量 。 解 特征 方程 1X1 - V|=0, 求 出 V 的 一 切 非 零 
特征 根 ,并 依 大 小 顺序 排列 成 41 宇 42 宇 … 宇 丸 >>0( 其 余 p -& 个 特征 根 均 为 0); 
然后 求 出 这 & 个 特征 根 11,…, 相应 的 & 个 特征 矢量 ,并 将 其 单位 化 ,得 到 单位 
化 特征 矢量 a1,…, a。 


2) 从 相关 系数 矩阵 出 发 


在 实际 问题 中 ,进行 主 成 分 分 析 时 往往 遇 到 P 个 指标 代表 不 同 的 量 ,其 度量 
单位 也 就 不 一 样 。 不 仅 如 此 ,更 重要 的 是 当 某 一 变量 改变 计量 单位 后 ,其 协 方差 阵 
V 就 会 发 生变 化 。 自 然 相应 于 协 方差 阵 的 特征 根 也 要 发 生变 化 ,从 而 使 相应 的 特 
征 矢量 也 发 生 改 变 , 最 后 导致 主 成 分 改变 。 为 了 克服 这 一 不 足 , 通 常 先 把 各 变量 进 
行 标准 化 变换 , 此 时 标准 化 后 的 随机 矢量 的 协 方差 阵 V* 正好 等 于 原 随机 矢量 
X= (zx1,…,xp) 的 相关 矩阵 尺 , 因 此 也 可 以 从 X 的 相关 矩阵 尺 出 发 , 求 原来 户 个 
指标 的 主 成 分 。 

(1) 计算 相关 系数 矩阵 


Tl 7 了 12 Tip 
rol To 2 

1 6 (13.53) 
rpl ?Tp2 YY Tpp 


因为 R 是 实 对 称 矩 阵 ,所 以 只 需 计算 其 上 三 角 元 素 或 下 三 角 元 素 即 可 。 
(2) 计算 特征 值 与 特征 矢量 。 解 特征 方程 | 41 一 R| =0, 并 依 大 小 顺序 排列 成 
和 1 宇 %5 宇 … 宇 吕 >0( 其 余 p -& 个 特征 根 均 为 0); 然 后 求 出 这 上 个 特征 根 和 A,…， 
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44 相应 的 & 个 特征 矢量 。 

一 般 来 说 ,从 相关 和 矩阵 尺 求 得 的 主 成 分 与 从 协 方差 阵 了 求 得 的 主 成 分 是 不 相 
同 的 。 通 常 ,在 变量 的 度量 单位 不 相同 时 ,从 相关 矩阵 R 出 发 求 主 成 分 是 比较 恰 
当 的 ,但 当 协 方差 阵 Y 中 的 主 对 角 线 上 各 元 素 相差 不 大 时 ,为 简单 起 见 , 也 可 以 直 


接 由 Y 来 求 主 成 分 。 
2. 主 成 分 方差 贡献 率 与 个 数 的 确定 


主 成 分 y: 贡献 率 ; AM/ > X4(i = 1.2,… ,2) ,累积 贡献 率 : >) Ma/ YN。 如 


果 前 m 个 主 成 分 的 累积 方差 贡献 率 超过 了 85%, 则 就 用 这 前 mx 个 主 成 分 y1， 
2 的 变化 来 刻画 X 的 如 个 分 量 zi,zz，…zp 的 变化 。 


思 考题 


1. 我 国 1991 一 2002 年 期 间 的 第 一 、 二 、 三 产业 及 人 均 国 内 生产 总 值 数据 
见 表 1。 


表 1 国内 生产 总 值 发展 速 度 (%) 
按 可 比价 格 计算 上 年 = 100 









































(1) 计算 我 国 三 大 产业 与 人 均 国 内 生产 总 值 之 间 的 复 相关 系数 。 
(2) 建立 我 国 三 大 产业 与 人 均 国 内 生产 总 值 之 间 的 线性 回归 模型 ,并 在 置信 
水 平 a=0.01 下 ,对 模型 进行 显著 性 检验 。 
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2. 用 最 短 距离 法 、 重 心 法 对 表 2 中 12 个 地 区 城市 进行 城市 设施 水 平 聚 类 
分 析 。 


表 2 12 个 地 区 城市 设施 水 平 (2001 年 ) 





每 万 人 拥 
有 公共 周 
所 / 座 


人 均 住宅 | 人 均 住 宅 | 城市 人 口 | 城市 燃气 | 每 万 人 拥有 | 人 均 拥 有 | 人 均 公共 







15.91 100.00 
18.64 14.10 76.40 49.62 


18.89 13.41 
16.88 45.04 32.23 


76.71 84.72 
71.91 
60.31 








5.99 5.48 
6.33 8.15 
7.91 
1.26 




































4.50 




















12.15 
15.64 




















工 1 二 (5,2) ,Za 一 (1,3) ,zx3= ($5,7) 
且 有 共同 的 协 方差 阵 为 


Tv- 几 1 ) 


1 1.5 
求 Fisher 线性 判别 函数 ,并 判断 样品 X= (2,4) 的 归属 。 
4. 对 表 2 中 城市 设施 水 平 的 8 项 指标 进行 主 成 分 分 析 。 
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14.1 概 述 


地 图 符号 发 展 至 今 , 普通 地 图 尤其 是 地 形 图 符号 ,已 逐渐 形成 为 一 个 较为 科学 
系统 的 体系 。 地 形 图 已 基本 实现 标准 化 和 现代 化 ,但 专题 地 图 符号 却 未 形成 系统 
的 体系 。 随 着 现代 科学 技术 的 发 展 和 各 学 科 的 相互 渗透 ,专题 地 图 内 容 朝 着 综合 
制图 、 多 层面 制图 、 多 视觉 制图 \ 时 空 动态 制图 等 方向 发 展 ,并 出 现 了 机 助 制图 、 通 
感 制图 .GIS 等 现代 技术 。 所 以 ,为 了 适应 地 图 的 发 展 和 新 技术 的 要 求 ,对 地 图 符 
号 的 研究 应 该 着 重 研究 内 在 结构 及 其 规律 性 , 探讨 地 图 符号 的 组 织 结构 和 设计 
模式 。 


14.1.1 地 图 符号 构成 元 素 组 成 


传统 地 图 学 把 地 图 符号 的 结构 概括 为 图 形 、 大 小 和 色彩 三 个 基本 要 素 。 随 着 
现代 科学 技术 的 发 展 ,把 这 些 要 素 作 为 地 图 符号 的 基本 构成 已 是 很 不 完善 的 。 符 
号 视觉 变量 是 从 地 图 感受 论 引 出 的 。 如 从 地 图 传输 论 的 角度 去 探讨 , 从 方便 制图 
实践 应 用 出 发 ,地 图 符号 的 基本 图 形 要 素 可 称 为 符号 构成 元 素 SCE(symbolic con- 
stitution elements) 。 

地 图 符号 构成 元 素 即 组 成 一 切 符号 (系统 ) 的 基本 因素 ,是 地 图 上 最 小 的 图 解 
单元 。 它 由 八大 元 素 组 成 :位 置 P(position)、 形 状 F(form)、 色 彩 H(hue, 含 色 相 
HI1 ,纯度 H2 和 亮度 H3)、 尺寸 (size, 含 大 小 S1 ,粗细 S2 ,长短 S3 和 分 割 比例 S4)、 
网 纹 下 (texture, 含 排列 Tl 和 玖 密 T2) 方向 D(direction) 、 注 记 N(notation, 含 文 
字数 字 N1 和 字体 、 字 级 N2) 和 行为 A(action, 符 号 在 不 同 状态 下 的 行为 和 表现 形 
式 )。 这 些 元 素 分 别 体现 于 点 、 线 、 面 状 符号 之 中 。 

P 指 符号 在 图 上 的 定位 ,平面 位 置 由 z、y 坐标 标定 。 如 点 状 符号 的 位 置 一 般 
指 符号 中 心 点 ; 线 状 符号 的 位 置 一 般 指 符号 中 心 线 , 也 有 由 符号 轮廓 线 组 成 的 (如 
双 线 河 ); 面 状 符号 一 般 指 符号 的 轮廓 线 。F 指 符号 不 同 外 形 所 组 成 的 图 形 特征 。 
点 状 符号 形状 是 符号 本 身 外 形 , 包 括 几何 符号 ,象形 符号 和 艺术 符号 等 ; 线 、 面 状 符 
号 的 形状 界定 为 组 成 线 或 面 的 点 集 的 形状 变化 ,并 不 指 线 或 面 状 符号 外 部 轮廓 界 
线形 状 (轮廓 线 实际 上 是 表示 位 置 元 素 的 变化 ) 。 符 号 的 形状 变化 是 无 限 的 。H 表 
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示 符 号 的 色相 HL、 纯 度 H2 和 亮度 H3 变化 。 点 、 线 \ 面 状 符号 都 有 不 同 的 色相 、 纯 
度 和 亮度 变化 。 从 理论 上 讲 , 色 彩 的 变化 是 无 穷 的 ,但 人 眼 能 区 分 识别 的 色彩 却 是 
有 限 的 。S 为 符号 的 大 小 S1、 粗 细 S2 ,长短 S3 和 分 割 比例 S4 的 变化 特征 。 点 状 
符号 的 大 小 表示 符号 的 面积 大 小 变化 ; 线 、 面 状 符号 的 大 小 表示 组 成 线 或 面 的 点 集 
的 大 小 变化 。 点 、 面 状 符号 的 粗细 表示 点 、 面 轮廓 线 的 粗细 变化 ; 线 状 符号 的 粗细 
表示 线 的 宽度 变化 。 线 状 符号 的 长 短 表示 线 的 结构 长 短 ( 如 虚线 的 长 短 ) 变 化 。 
点 、 线 状 符号 的 分 割 比 例 指点 内 或 线 内 按 比率 的 分 割 构成 。T 表示 构成 符号 的 晕 
点 .学 线 、 花 纹 的 排列 Tl 和 玖 密 T2 变化 特征 。 点 、 线 、 面 状 符号 的 排列 表示 符号 
内 尝 点 、 坚 线 、 花 纹 的 排列 变化 ;点 、 线 、 面 状 符号 的 玻 密 表示 符号 的 尝 点 、 坚 线 \ 花 
纹 的 朴 密 变 化 。 符 号 网 纹 的 变化 是 无 限 的 。D 表示 符号 的 方向 变化 。 个 体 符号 一 
般 有 方向 的 区 分 (个 别 符号 如 圆 无 方向 变化 ); 线 状 符号 的 方向 指 用 箭头 标明 的 方 
位 变化 。N 指 图 上 的 文字 数字 N1 和 字体 、 字 级 N2 的 变化 。 点 、 线 、 面 状 符号 一 
般 都 可 用 不 同文 字数 字 和 字体 、 字 级 的 变化 表示 其 名 称 、 定 性 或 定量 特征 。 在 专 
题 地 图 上 ,位 置 常用 来 表示 专题 内 容 的 空间 地 理 分 布 。 它 是 地 图 区 别 于 其 他 事物 
的 基本 特征 ,是 构成 元 素 中 的 “常数 项 ”, 也 是 不 可 缺少 项 。 形 状 、 色 彩 和 尺寸 是 最 
重要 的 符号 构成 元 素 ,在 地 图 符号 设计 中 最 为 常用 。 形 状 、 色 彩 中 的 色相 、 网 纹 中 
的 排列 易于 表达 要 素 的 质量 特征 ;尺寸 中 的 大 小 、 粗 细 \ 长 短 , 色 彩 中 的 纯度 、 亮 度 
和 网 纹 中 的 政 密 易于 表达 要 素 的 数量 特征 ;尺寸 中 的 分 割 比例 易于 表达 要 素 的 内 
部 组 成 情况 。 注 记 是 不 可 缺少 的 构成 元 素 之 一 。 文 字 注 记 表 示 要 素 的 质量 特征 
(如 文字 符号 、 地 名 注 记 和 说 明 注 记 ) ;数字 注 记 表示 要 素 的 数量 特征 ;字体 、 字 级 的 
变化 易于 表达 要 素 的 等 级 、 层 次 , 注 记 的 应 用 范围 十 分 广泛 。 行 为 特征 是 GIS 应 
用 发 展 对 地 图 符号 提出 的 新 的 要 求 , 要 求 符号 能 够 动态 根据 反映 特征 的 状态 呈现 
不 同 的 表现 。 





14.1.2 地 图 符号 几何 特征 


现实 世界 的 事物 形态 各 异 \ 千 变 万 化 ,但 描述 现实 世界 的 图 件 通常 采用 地 形 图 
和 各 类 专题 图 。 一 般 它们 可 看 做 是 符号 的 集合 ,而 且 从 几何 角度 看 ,描述 地 物 的 符 
号 不 外 乎 为 点 符号 、 线 符号 、 面 符号 ,专题 符 号 。 实 际 上 ,点 符号 、 线 符号 、 面 符号 虽 
各 有 其 特点 ,但 又 具有 共性 ,它们 的 差异 仅 是 构成 各 自 的 基本 图 素 不 同 ,而 它们 的 
绘制 参数 (符号 代码 绘图 句柄 \ 笔 的 颜色 刷子 的 颜色 等 ) 和 操作 方法 (绘制 .删除 
等 ) 则 基本 一 致 。 根 据 面向 对 象 的 观点 ,为 使 各 类 符号 对 象 具有 相对 独立 性 , 需 先 
将 点 符号 、 线 符号 、 面 符号 定义 成 三 种 符号 对 象 类 ,并 将 各 类 符号 的 数据 成 员 ( 属 性 
数据 ) 及 其 函数 成 员 (操作 方法 ) 封 装 在 各 自 的 对 象 类 中 ,然后 在 这 三 个 对 象 类 的 基 
础 上 ,概括 出 更 高 层次 的 超 类 , 即 符号 类 。 可 以 将 以 上 各 图 元 归纳 为 点 ` 线 ` 面 三 大 
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类 ,将 点 、 线 、 面 类 的 图 元 共有 的 属性 归纳 为 目标 类 ,这 样 再 构造 一 个 超 类 来 管理 各 
种 目标 (点 目标 、 线 目标 ` 面 目标) ,这 种 面向 对 象 的 符号 设计 可 以 很 容易 地 实现 符 
号 整体 和 符号 内 部 ( 即 图 元 ) 的 各 种 管理 和 操作 , 大 大 方便 了 符号 的 设计 
(图 14.1)。 


一 || 有 
般 | | 向 
点 || 点 
图 | | 图 
元 || 元 





图 14.1 符号 类 设计 
如 点 符号 土 堆 上 的 三 角 点 的 设计 (图 14.2) ,其 组 成 图 元 为 :1 个 点 状 图 元 .6 
个 线 状 图 元 \1 个 面 状 图 元 ,这 正体 现 了 符号 设计 时 的 内 部 类 结构 和 符号 的 构造 


14.2 土 堆 上 的 三 角 点 


14.1.3 基于 SVG 的 地 图 符号 描述 模型 


目前 很 难 用 一 种 模式 描述 每 一 个 地 图 符号 。 地 图 符号 的 描述 方法 可 分 为 文 
字 、 数 学 方法 , 半 结 构 数 据 模 型 XML、GML、SVG 描述 等 阶段 。 各 阶段 既 有 优点 ， 
也 有 缺点 。SVG 能 描述 任意 复杂 的 图 形 ,可 以 应 用 于 复杂 地 图 符号 的 描述 格式 。 

SVG 是 W3C 制定 的 基于 XML 开放 标准 的 文本 式 标记 语言 。 根 据 功 能 不 同 ， 
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SVG 的 主要 对 象 可 归 为 基本 要 素 对 象 和 描述 功能 对 象 两 大 类 。 基 本 要 素 对 象 不 
仅 支 持 文字 、 图 像 和 基本 图 形 ,而 且 对 于 贝 塞 尔 曲线 也 同样 支持 ,并 引 人 路 径 的 概 
念 。 描 述 功 能 包括 字体 描述 .坐标 变换 ,填充 .透明 链接、 描 边 ,动画 .显示 方式 、 剪 
切 路 径 、 组 合 对 象 及 箭头 等 。 标 记 语言 是 使 用 "记号 "来 表示 格式 或 数据 信息 的 语 
言 ;地 图 是 使 用 地 图 符号 记录 地 理 信 息 的 一 种 图 形 语言 形式 ;地 图 符号 是 地 理 信息 
的 标记 语言 , 它 由 图 形 构成 ,可 以 用 图 形 标记 语言 SVG 来 标记 (图 14.3)。 









标记 数据 
地 理 数 所 省 地 图 符号 |- 
SR 9 要 
| 符号 类 ”| 地 图 符号 模板 |- SVG 文档 结构 
示 记 格式 
svo | 


9 为 组 成 关系 仿 为 继承 关系 
图 14.3 基于 SVG 的 地 图 符号 描述 模型 


基于 SVG 的 地 图 符号 描述 模型 包括 概念 模型 .逻辑 模型 和 物理 模型 。 概 念 模 
型 包括 两 种 标记 :一 种 是 地 图 符号 标记 表示 地 理 数据 ; 另 一 种 是 SVG 标记 表示 地 
图 符号 。 在 逻辑 模型 中 ,SVG 标记 地 图 符号 具体 表现 为 地 图 符号 由 图 形 按照 一 定 
的 描述 规则 构成 和 用 SVG 标记 图 形 格式 两 部 分 。 根 据 地 图 符号 的 结构 特征 和 实 
现 机 制 ,在 地 图 符号 与 基本 图 形 之 间 插入 中 间 件 一 一 模板 ,构成 了 地 图 符号 描述 的 
物理 模型 。 

地 图 符号 是 按照 一 定 的 规则 将 符号 模板 配置 在 参考 位 置 上 ,对 地 理 信息 进行 
可 视 化 。 一 个 完备 的 地 图 符号 描述 方法 应 该 满足 以 下 要 求 :名 能 充分 表达 地 图 符 
号 的 几何 形状 ;名 能 方便 地 定义 地 图 符号 的 专题 属性 , 且 易 于 扩充 ;能 方便 地 定 
义 地 图 符号 与 外 界 的 交互 功能 ;@ 能 够 对 地 图 符号 的 几何 形状 和 专题 属性 进行 存 
取 和 显示 。 基 于 SVG 的 地 图 符号 描述 模型 能 满足 以 上 要 求 , 地 图 符号 的 BNF 描 
述 可 以 表示 如 下 

《地 图 符号 类 ) : : = (显示 环境 )( 地 图 符号 》 

《显示 环境 : : = 比例尺) 显示 时 间 )( 地 图 图 形 》 

《地 图 符号 ): : = 符号 形状 定义 ;[〈 专 题 属 性 定义 兴 交 互 事 件 定义 兴 宽 度 认 高 
度 )( 坐 标 单位 )] ; (符号 形状 定义 ) : : = (符号 模板 定义 )( 符 号 绘制 规则 定义 )《 参 考 
位 置 》 

《符号 绘制 规则 定义 ); : = (平移 )| 《坐标 映射 ;1《 填 充 》 

(填充 ): : = ( 单 色 填充 ) | 渐变 色 填 充 )| (图案 填 充 )| (模式 填充 》 
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“专题 属性 定义 ) : : = 专题 属性 )[ 1 专题 属性 | ]; 《专题 属 性 ) ; : = 长 属性 名 》 
=《 属 性 值 )} ; 《交互 事件 定义 ); := 《交互 事件 )[1( 交 互 事件 ?上 ;交互 事件 ):: = 
长 事件 名 > =《〈 响 应 函数 )| ;坐标 映射 ): : = 《坐标 变换 )[ {坐标 变换 )|] | 

地 图 符号 的 描述 模型 用 SVG 描述 见 表 14.1, 它 的 专题 属性 可 用 自 定义 的 元 
素描 述 。SVG 定义 了 大 量 的 标准 事件 支持 地 图 符号 与 脚本 语言 的 交互 功能 ,如 果 
使 用 DOM 规范 , 则 脚本 还 可 以 注册 自己 的 特定 事件 并 进行 处 理 。 


表 14.1 地 图 符号 的 SVG 描述 





基本 属性 


Translate, scale, rotate, skewX, skewY 






地 图 符号 的 描述 SVG 要 素 
平移 .坐标 变换 transform 
填充 fill 

专题 属性 mapAttribute 
交互 时 间 script, DOM 

















color, gradient, image, pattern 





















14.2 点 状 地 图 符号 的 绘制 


点 状 符 号 可 以 理解 为 有 一 个 模板 且 仅 使 用 一 次 经 排列 或 变形 而 成 。 故 对 于 点 
状 符号 来 说 , 在 应 用 时 ,只 需要 将 符号 模板 按 符号 的 定位 点 或 定位 点 和 方向 控制 
点 以 相应 的 比例 显示 出 来 (具体 的 设计 可 参考 线 状 符号 的 设计 过 程 ,唯一 不 同 的 
是 点 状 符 号 只 有 一 次 循环 )。 


14.2.1 圆 的 绘制 


圆 在 地 图 上 常 作为 定位 分 级 符号 ,其 圆心 定位 在 要 素 的 中 心 位 置 , 圆 的 面积 表 
示 相 应 的 数量 指标 。 

圆 是 由 正 多 边 形 副 近 的 , 当 多 边 形 的 边 

数 多 到 人 有 眼 分 辨 不 出 是 多 边 形 时 ,就 形成 了 

圆 形 。 显 然 , 当 边 数 不 够 时 就 不 像 圆 形 ,但 

若 边 数 过 多 时 ,会 使 计算 和 输出 量 增加 ,其 

至 引起 笔迹 扩散 ,影响 图 形 效果 。 解 决 的 方 

法 是 :考虑 各 近 圆 的 多 边 形 上 任意 相 邻 三 个 

顶点 构成 的 等 腰 三 角形 的 高 度 妃 , 控制 妃 

在 一 定 限度 ,以 致 人 眼 分 辩 不 出 三 点 连 线 是 

图 14.4 圆 一 折线 (图 14.4)。 设 圆 的 半径 为 尺 ,多边 形 
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的 等 分 角度 为 9。 
显然 ,H= RR.cos0 
则 0= arccos(1- 公 | 
这 里 互 一 般 控制 在 0.01 一 0.03 比较 适宜 。 
到 近 加 的 多 边 形 N 为 N= 人。 
根据 9 和 N 以 及 公式 可 得 多 边 形 各 点 坐标 : 
X= Xo+ Rcosa 
Y= Yot+ R'sina 
式 中 ,Xo、Yo 为 圆心 坐标 ;a 从 圆 弧 的 起 始 角 ANG1 以 增 量 9 变化 到 终止 角 
4NG2 ,并 约定 : 当 终止 角 大 于 起 始 角 时 , 按 逆 时 针 方 向 绘制 ,否则 按 顺 时 针 方 向 


绘制 。 
下 面 将 给 出 圆 弧 绘制 的 算法 流程 (图 14.5)。 










入 口 参数 : X0,70,R 
ANGIANG, 






AG1=0.01745#ANG 
AG,=0.01745#ANG, 













N=| 4G,-AG! |/arccos (1- L018 
DA=(4G,-AGIYN 


)+1 







W=AG!+h DA 
X=X0tR*cos(W) 
Y=YorR*sin(W) 


是 i 
落笔 绘 至 (%,7) 抬 笔 移 至 (用 









图 14.5 圆 弧 绘 制 算法 流程 图 


。 314 。 地 理 信 息 系 统 算 法 基础 





14.2.2 椭圆 的 绘制 


椭圆 由 于 具有 长 轴 和 得 轴 , 它 可 同时 表示 一 种 现象 的 两 个 数量 指标 。 
椭圆 也 是 由 多 边 形 逼 近 而 成 的 , 其 绘制 方法 同 圆 驱 绘制 相似 。 椭 圆 的 绘图 参 
数 为 :中 心 坐标 (Xo, Yo) , 横 半 轴 长 度 、 纵 半 轴 长 度 B, 横 轴 与 X 轴 的 夹 角 ANG0， 
椭圆 弧 的 起 止 角 度 ANG1 和 ANG2。 
逼近 椭圆 的 多 边 形 等 分 角 0 为 
H 
0= arceos(1 -RR ) 
式 中 ， 
> a>6 
La b>a 
这 里 互 一 般 控制 在 0.01~0.03 比较 适宜 。 
正 椭圆 弧 上 坐标 公式 为 
X= Xo+ acosa 
Y= Yot+ bsina 
横 轴 与 X 轴 夹 角 为 8 的 椭圆 坐标 公式 为 
X= Xo0o+acosacosB — bsinasinp 


Y= Yo+ acosasing + bsinacosB 


式 中 ,Xo、 Yo 为 椭圆 中 心 坐 标 。 角 度 a 从 椭圆 弧 的 起 始 角 开始 以 9 为 增 量变 化 至 
椭圆 弧 的 终止 角 。 
下 面 将 给 出 椭圆 或 椭圆 弧 绘 制 的 算法 流程 图 (图 14.6)。 


14.2.3 多 边 形 的 绘制 
正 多 边 形 是 常用 的 几何 符号 ,地 图 上 很 多 符号 就 是 由 三 角形 方形、 五 角形 等 


正 多 边 形 构成 的 (图 14.7)。 
设 多 边 形 外 接 圆 中 心 坐标 为 (Xo, Yo) ,半径 尺 , 边 数 为 N, 底 边 和 XX 轴 夹 角 


底 边 左 端点 的 起 始 角 Wo= a + 
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入 口 参数 : X,Y】60, 4, B， 
ANGo, ANG. ANG, 








AGo=0.01745*ANG, 
4G1=0.01745#ANG! 
AG,=0.01745* ANG, 









N=| 4G,-AG! |/arccos (1- 1.018 
DA=(4Gy_AGIYN 









W=AGI+RDA 
X=A*cos(W), Y=B*sin(W) 

DX=X0+X*cos(AG0)-Y*sin(4G0) 

DY=YotX*sin(A4Go0)+Y*cos(AGo) 


eS 否 
是 
落笔 绘 至 (0X,7) 抬 笔 移 至 (4 力 







图 14.6 绘制 椭圆 或 椭圆 弧 的 算法 流程 





图 14.7 多 边 形 


多 边 形 上 各 分 点 的 坐标 
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X= Xo+ ReosW 
Y= Yo+ RsinW 
WW 从 Wo 开始 以 9 为 增 量变 化 至 2x + Wo。 
下 面 将 给 出 正 多 边 形 绘制 的 算法 流程 图 (图 14.8)。 






入 口 参 数 : 中 心 坐标 和 ,了 ]， 
半径 R, 边 数 N, 角 度 4NG 









DW=2n/N 
Wa=0.01745#4ANG- 下 













W=W+RDW 
X=X0+R+cos(W) 
=Y0+rRrsin(W) 


< > 否 
是 
落笔 绘 至 (4 及 抬 笔 移 至 (XY, 







图 14.8 绘制 多 边 形 的 算法 流程 


14.2.4 五 角 星 的 绘制 


绘制 五 角 星 的 参数 为 ;中心 坐标 (Xo, Yo) ,外 接 圆 半径 R。 由 于 五 角 星 的 10 
个 顶点 等 分 整个 圆周 角 2r, 所 以 两 相 邻 点 和 中 心 连 线 的 夹 角 都 是 -5 (图 14.9)。 下 


面 推算 内 接 圆 的 半径 R 。 
由 图 14.9 中 A 和 B 两 点 的 Y 坐标 相等 可 得 
/x 2r 
) = Rsn( 王 -所 


nT 


Risin 人 于 5 


第 14 章 数据 输出 算法 .317 ， 








图 14.9 五 角 星 






入 口 参数 : 中 心 坐 标 X0,7， 
外 接 圆 半径 R 





Ri=R’  R,=0.38196*R 
ANG= 焉 -下 天 
2-5 El 


抬 笔 移 至 Cgo,yo+R) 








X=XtRI#cos(ANG) 
Y=Y0+RI*sin(ANG) 









从 =Xo+R2*cos(C4NO) 
IT 了 =Jo+R2rsinC4dNO) 





ANG=AN 人 
I=1+] 






图 14.10 绘制 五 角 星 的 算法 流程 
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2 


-5 
从 而 全 = 一 ~ 0.381 966 02 


cos 工 


5 
所 以 Rs0.381 966. 民 


下 面 将 给 出 五 角 星 绘制 的 算法 流程 图 (图 14.10)。 


14.3 线 状 地 图 符号 的 会 制 


线 状 符号 的 设计 是 一 个 较为 复杂 的 过 程 。 将 符号 的 基本 信息 描述 为 模板 ,再 
把 模板 在 中 轴线 上 分 段 串 接 并 作 相 应 的 变形 处 理 ,尤其 是 拐弯 处 。 取 线 状 符号 的 
基本 最 小 循环 单元 (包括 有 效 的 空白 ) 作 为 模板 中 的 主要 图 元 的 描述 , 求 出 外 接 矩 
形 , 作 为 模板 串 接 或 变形 时 参与 运算 的 图 元 的 有 效 范围 ( 即 只 考虑 矩形 内 的 图 元 信 
息 )。 按 模板 的 长 度 在 中 轴线 土 分 段 截取 , 若 模板 超出 拐点 则 将 截 去 超出 部 分 , 截 
去 部 分 转 到 下 一 折线 段 内 处 理 。 对 有 截取 部 分 的 模板 实行 从 和 矩形 到 四 边 形 的 变形 
处 理 , 如 图 14.11 所 示 。 对 于 线 状 符号 的 绘制 过 程 如 图 14.12、 图 14.13 所 示 , 其 
算法 如 下 : 线 状 要 素 的 中 轴线 为 kim ,地 图 坐标 系 为 zOy ,模板 所 在 的 局 部 坐标 系 
为 zOy ,模板 的 外 接 和 矩形 为 abcd , 结 点 ; 和 m 处 的 角 平 分 线 分 别 为 gg 和 有 hh”, 模 
板 在 结 点 m 处 被 分 割 为 cpe 和 fecd 两 段 。 分 割 线 ef 通过 x 且 垂 直 于 zz 。 两 条 
角 平 分 线 和 分 割 线 将 模板 分 割 为 3 个 点 集 ,并 作 不 同 处 理 。 


r----~------~-~----------- Cr---------------------- 


图 14.11 和 矩形 图 元 变形 


(1) 在 局 部 坐标 系 zOy 中 , 若 模板 中 
的 点 p(xzp, yp) 满 是 0<zxp<xi, 且 点 
在 两 角 平 分 线 之 间 , 则 该 点 不 作 变 形 处 

理 , 只 按 一 般 方法 从 局 部 坐标 系 变 换 至 地 
图 坐标 系 ; 

(2) 在 局 部 坐标 系 zOy 中 , 若 模板 中 
的 点 p(xp ,yp) 满 足 xp=0 或 xp = xi 或 
0< zsp< zi, 且 pp 点 不 在 两 角 平 分 线 之 

间 , 则 该 点 沿 z 轴 正 向 或 负 向 平移 至 附近 
14.12 线 状 符号 模板 的 角 平 分 线 上 ,然后 变换 至 地 图 坐标 系 。 
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图 14.13 线 状 符号 绘制 过 程 


图 中 Aalg、Afmrh 内 的 点 便 属 于 这 种 情况 ; 

(3) 点 超出 结 点 mx 的 部 分 , 即 四 边 形 fecd 内 的 点 如 (zs ,yw) ,在 局 部 坐标 系 中 
满足 zx, 宇 xi, 则 将 这 些 点 转 入 下 一 节 mn 中 进行 处 理 , 重 复 以 上 过 程 , 直 至 符号 全 
部 完成 。 


14.3.1 平行 线 绘制 


平行 线 是 由 两 条 距离 相等 的 平行 曲线 构成 的 (图 14.14) ,通常 用 于 表示 道路 
等 地 物 。 设 平行 线 的 绘图 参数 为 :定位 曲线 坐标 X;、Y; (i =1,2,…, x) ,平行 线 宽 
度 W。 

曲线 是 由 一 系列 的 直线 连接 而 成 的 。 绘 制 平行 线 就 是 绘制 定位 曲线 各 直线 段 
两 侧 的 平行 线段 组 成 的 两 条 曲线 ,为 了 提高 绘图 速度 ,采用 对 平行 的 两 条 曲线 相互 
反 向 绘制 的 方式 。 具 体 的 绘制 方法 如 下 。 





” 


图 14.14 平行 曲线 图 14.15 平行 线 交 点 示意 图 
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入 口 参数 : 数组 了 元 素 个 数 入 ,宽度 所 





删除 %7 中 相 邻 点 
置 R=W/2 Z=1 


是 
NA=2,NB=N,K=!1 | INA=N-1,NB=1,K=-1 


AK=(Y(D-YU-K)AXL) AX-K)) 
A=arctan (4AK) 
AX=X(I—-K)+R* con (A+n/2) 
AX=Y(I—-K)+R* sin (A+n/2) 


捅 笔 移 至 (4X,A7) 


AY-(AY-BY-AK* AX+BK* BXY(BK-_AK) 
AY=BY+BK CT BID 


AX=X(NB)+R*cos(A+7/2) 
AY=Y(NB)+R* SIn( +7/2) 
L=L 


图 14.16 绘制 平行 线 的 算法 流程 
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首先 计算 过 首 点 (Xi, Yi ) 并 和 首 段 直线 成 90° 的 垂 线 上 距离 首 点 W 人 2 处 的 
坐标 点 (XI, Y1) , 称 该 点 为 首 点 的 等 距离 旁 点 , 抬 笔 移 至 点 (Xi, Y1)。 青 有 第 二 
点 的 坐标 (Xz, Y2z) 以 及 第 二 段 直线 求 出 第 二 点 的 等 距 旁 点 坐标 (Xi , Y2)。 根 据 
两 个 相 邻 的 等 距 旁 点 坐标 以 及 相应 的 两 段 直线 的 斜率 计算 出 两 段 直线 平行 线 的 交 
点 坐标 ,然后 落笔 绘 线 至 该 交点 ,这样 就 完成 了 一 条 平行 线 上 首 段 直线 的 绘制 。 接 
下 去 向 前 不 断 地 计算 出 平行 线 的 各 相 邻 直线 段 的 交点 坐标 (平行 线 的 结 点 坐标 )， 
并 同时 绘 线 连接 各 结 点 ,平行 线 的 末端 点 即 为 坐标 (X,, Y; ) 的 等 距 旁 点 。 在 第 一 
支 平行 线 绘制 完成 后 ,再 按 反 向 计算 和 绘制 定位 曲线 另 一 侧 的 一 文平 行 线 
(图 14.15)。 

平行 线 的 绘制 算法 流程 如 图 14.16 所 示 。 


14.3.2 虚线 绘制 


虚线 是 由 一 系列 相间 排列 的 等 长 短线 段 构成 的 。 虚 线 亦 称 间 断 线 。 地 图 上 常 
采用 虚线 绘制 大 路 、 等 高 线 的 间 曲 线 等 地 形 地 物 。 设 虚线 的 绘图 参数 为 :定位 曲线 
的 坐标 和 坐标 个 数 (X;, Y;)i=1,2,…,n, 虚 线段 的 长 度 DIS; ,虚线 段 的 间距 
DIS,。 

虚线 的 绘制 方法 为 :首先 控制 抬 笔 移 至 定位 曲线 的 首 端点 (Xi, Yi) ,按照 定位 
曲线 的 路 径 和 方向 搜索 并 计算 出 距离 笔 位 曲线 长 度 为 DIS; 的 坐标 点 (X1, Y1)， 
并 控制 落笔 绘 线 至 该 点 ,再 按 定位 曲线 的 路 径 和 方向 向 前 搜索 并 计算 出 距离 当前 
笔 位 曲线 长 度 为 DIS; 的 坐标 点 (X2, 72 ) ,控制 抬 笔 移 至 该 点 ,然后 再 搜索 计算 出 
定位 曲线 上 前 方 距离 当前 笔 位 曲线 长 度 为 DIS1 的 坐标 点 (X3, Y3), 并 控制 落笔 
绘 线 至 该 点 ,如 此 反复 地 计算 出 各 虚线 段 的 端点 ,并 不 断 抬 笔 移动 和 落笔 绘 线 ,最 
终 绘 成 虚线 (图 14.17)。 


图 14.17 虚线 


按 这 种 方法 绘制 的 所 有 虚线 段 完 全 落 在 定位 曲线 的 路 径 上 ,虚线 中 的 各 个 虚 
线段 长 度 相等 ,每 节 虚 线段 可 能 是 直线 ,也 可 能 是 折线 ,这 取决 于 对 应 的 一 段 定 位 
曲线 的 形状 。 图 14.18 为 绘制 虚线 的 算法 流程 。 
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DIS,DIS, 
Y OA AD HD 


KD-KU1) 
XD-XU-1) 


2 
是 
DX=X(I-1)+R*cos(A) 落笔 绘 至 CX, 站 


DY=Y(I-1)+R*sin(A) 












A=arctan 





R=R-DIS 
EI+l 


落笔 绘 至 (DX,DY) 捅 笔 至 (DX,DY) 


Tw = 
R=R+DIS, R=R+DIS, 是 


14.18 绘制 虚线 算法 流程 


14.3.3 短 齿 线 的 绘制 


短 齿 线 是 由 一 条 实 曲线 和 等 间距 垂直 各 加 在 其 上 的 许多 短 齿 构成 (图 14.19)。 
短 齿 线 在 地 图 上 一 般 用 来 表示 道路 等 地 物 。 绘 制 短 齿 线 的 参数 为 :定位 曲线 坐标 
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图 14.19 短 齿 线 


和 坐标 个 数 (X; > Yi)i =1 $23 “ \ 短 齿 的 宽度 W 、 相 邻 短 齿 之 间 的 距离 DIS 。 
绘制 方法 为 :首先 抬 笔 移 至 曲线 的 首 点 (Xi, Yi) , 按 曲线 的 路 径 和 方向 搜索 并 


入 口 参数 : 数组 六 上 元 素 
个 数 N,DIS,W 


抬 笔 至 (XD,KD) 
CDAD HUD DY 


VD-YU-L) 
A=arctan XRD 



























DX=X(I-1)+R* cos(A) 
DF=Y(I-1)+R* sin(A) 


落笔 绘 至 (DX,DY) 


AX=DX+DX*cos(A4+n/2) 
AY=DY+DW*sin(4+7/2) 
BX=DX+DW*cos(A~7/2) 
BY=DY+DW*sin(4-7/2) 


落笔 绘 至 CD,XD) 






















抬 笔 绘 至 (4X,47), 
(BX,BY),(DX,DY) 





图 14.20 绘制 短 齿 线 的 算法 流程 
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计算 出 距离 当前 笔 位 曲线 长 度 为 DIS 的 坐标 点 (XI, Y1 ) ,控制 落笔 绘 至 该 点 , 以 
该 点 为 中 心 。 根 据 该 点 所 在 的 直线 段 的 角度 和 短 齿 宽度 W, 计 算出 过 该 点 的 短 齿 
端点 坐标 ,并 控制 落笔 绘制 短 齿 , 笔 归 点 (Xi, Y1)。 以 后 按照 同样 的 方法 依次 向 
前 不 断 地 计算 和 绘制 短 齿 间 的 曲线 和 短 齿 ,直至 整个 曲线 坐标 处 理 完 毕 ,就 完成 了 
短 齿 线 的 绘制 。 

假设 曲线 上 某 短 齿 的 中 心 点 坐标 为 (Xk, YK ), 短 齿 的 两 个 端点 坐标 为 (Xa， 
Ya)、(XBp, YBg), 点 (XK，, YK) 所 在 直线 段 的 角度 为 a, 则 


YBp 一 YK 十 Tsin ax 
图 14.20 给 出 了 短 齿 线 的 绘制 算法 流程 图 。 
14.3.4 铁路 线 的 绘制 


铁路 线 是 地 图 上 表示 铁路 分 布 状况 与 走向 的 符号 , 它 是 由 一 条 双 平 行 线 和 其 
中 黑白 相间 的 色 块 构成 的 (图 14.21)。 绘 制 铁路 线 的 参数 为 :定位 曲线 坐标 (X;， 
Y;)i=1,2,…,n ,铁路 线 的 宽度 W。 一 般 铁 路 线 中 黑白 色 块 的 长 度 都 为 宽度 的 
3 信 。 


图 14.21 铁路 线 
铁路 线 的 绘制 方法 为 :首先 在 定位 曲线 两 侧 绘 制 一 条 宽度 为 W 的 平行 线 , 然 
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后 按 定位 曲线 的 路 径 和 方向 从 首 端点 (Xi, Y1) 开 始 向 前 搜索 和 计算 出 一 段 长 度 为 
3W 的 曲线 坐标 (AXi ,AYi)k=1,2,…,m, 调 加 粗 程 序 将 这 段 曲 线 加 粗 到 W。 


绘 铁路 线 入 口 
个 数 入 ,宽度 到 


置 : 11=B,R=0 
DR=3,1=2,J=0 


绘制 平行 线 子 程序 
PARALL(X,Y,N,W) 


DIS= | CDK DY + YID-YI-DY 


YD-KU-1) 
XD-XI-1) 








A=arctan 


/Hl Ftl 
AX(N=XU-1)+R*cos(A) AX(IXD 
AY(N=Y(I-1)+R*sin(A) AY(N=TD 






绘制 加 粗 线 子 程序 
THICH(AXAYJ,W)J=0 


图 14.22 铁路 线 绘制 算法 流程 图 


. 326， 地 理 信息 系统 算法 基础 





从 点 (AX ,AY) 开 始 , 沿 定位 曲线 路 径 向 前 搜索 并 计算 出 趾 离 该 点 曲线 长 度 为 
3W 的 坐标 点 ,控制 抬 笔 移 至 该 点 ,以 此 点 为 新 的 起 点 ,按照 上 述 方法 搜索 .计算 和 
绘制 下 一 个 黑白 色 块 ,这 样 不 断 地 向 前 绘制 黑白 色 块 ,直至 定位 曲线 末 点 , 便 绘 成 
了 铁路 线 。 

图 14.22 给 出 了 绘制 铁路 线 的 算法 流程 图 。 


14.3.5 境界 线 的 绘制 


境界 线 是 地 图 上 表示 国家 或 行政 区 域 边 界 轮廓 及 范围 的 线 状 符号 ,使 用 较 多 。 
国境 界 一 般 由 相同 大 小 的 “I” 型 符号 加 点 相间 排列 构成 ,省 区 界线 一 般 由 相同 长 度 
的 虚线 加 点 相间 排列 构成 (图 14.23)。 设 绘制 境界 线 的 参数 为 :定位 曲线 坐标 
(Xi Yi)i=1,2,…,n, 境 界线 中 虚线 的 长 度 DISi .间距 DIS, ,虚线 两 端 齿 线 的 宽 
度 克 ,对 一 绘制 省 区 境界 线 W=0。 绘 制 方法 描述 如 下 : 


or 


图 14.23 境界 线 


首先 抬 笔 移 至 定位 曲线 端点 (X1,Y1) ,车 W>0, 则 根据 该 点 坐标 、 直 线 (Xi 
yi) (X,Y;) 的 角度 以 及 W 求 出 过 该 点 的 齿 线 端 点 坐标 ,并 给 出 齿 线 , 笔 归 起 
点 (Xi, YY); 若 W=0, 则 不 需 计 算 和 绘制 齿 线 。 然 后 按 定位 曲线 的 方向 和 路 径 向 
前 搜索 并 绘制 到 距离 起 点 (Xi, Yi ) 曲 线 长 度 为 DIS; 的 点 (X1, Y1)。 若 W>0， 
则 根据 该 点 坐标 .所 在 直线 的 角度 以 及 W 求 出 过 该 点 的 齿 缘 端点 坐标 , 绘 出 此 
线 ; 若 W=0, 则 不 需 计 算 和 绘制 齿 线 。 再 按 定位 曲线 的 方向 和 路 径 向 前 搜索 并 求 
出 距离 点 (Xf, Yi) 曲线 长 度 为 DIS, 的 点 (Xi，Y2)。 在 点 | ,Oe 
处 绘 点 , 抬 笔 移 至 点 (Xi ,YZ) ,并 以 该 点 为 新 的 起 点 , 按 上 述 方法 开始 下 一 个 构图 
符号 的 绘制 ,直至 完成 境界 线 的 绘制 。 

显然 ,境界 线 的 绘制 既 有 和 绘 虚线 的 相似 之 处 ,又 有 绘 短 齿 线 的 特点 ,在 绘制 
算法 上 可 部 分 参照 。 图 14.24 给 出 了 绘制 境界 线 的 算法 流程 图 。 
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绘 境界 线 入 口 
入 口 参数 : 数组 入 了 元 素 个 数 NDSDS,W 


置 : [=3 R=0 
SUMD=DISI+D!S, 
WA=W/2 DR=DIS, 

EX=XD EY=Y(D 大 2 


















DIS= VO-XUI- DY + KD-TO-IY 
Y(D-YU-1) 
XD-X1) 






A=arctan 





AX=DX+ WA* cos(A+7n/2) 
AY=DY+ WA* sin(A+7/2) 

BX=DX+WA* cos(A—7/2) 
BY=DY+WA* sin(A—7/2) 


落笔 绘 至 (4X,47,(BX,B7),(DX,D7D 


DR=SUMD-DR R=R+DR 
L=7-L EX=DX EY=DY 


图 14.24 绘制 境界 线 的 算法 流程 
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14.4 面 状 地 图 符号 的 绘制 


面 状 符号 是 由 许多 点 状 符号 按 一 定 的 排列 方式 ( 品 字 型 .并 字 型 . 散 列 式 ) 进 
行 排列 组 合 而 成 的 。 点 状 符号 的 排列 方式 及 面 的 背景 均 在 面 状 符号 人 库 时 通过 参 
数 的 设置 来 控制 。 

在 一 给 定 的 区 域 范 围 之 内 均匀 地 布 绘 满 给 定 的 点 状 符号 ,是 绘制 表示 面 状 分 
布 要 素 情 况 的 专题 地 图 常 调 用 的 基本 功能 。 这 种 面 状 符号 的 绘制 参数 为 :区 域 的 
闭合 边界 坐标 (XX;, 到) = 1,2,…,2 ,坐标 个 数 NN, 点 状 符号 的 图 形 坐 标 ( GX;， 
GY'i, IP;)i 二 1,2,…,m ,图 形 坐 标 个 数 M , 布 绘 的 点 状 符号 个 数 NUM。 其 中 点 
状 符号 图 形 数据 IP; 为 抬 落 笔 标志 , IP; = 3, 表 示 ( GX, GY;) 为 抬 笔 点 ; IP; =4, 表 
示 (GX;, GY; ) 为 落笔 点 。 图 14.25 是 计算 机 绘制 的 几 种 面 状 符号 。 





图 14.25 几 种 面 状 符号 


这 种 符号 的 绘制 方法 为 : 

(1) 首先 求 出 点 状 符号 的 尺寸 PS ,在 闭合 边界 的 内 侧 求 出 距 闭 合 边 界 PS2 
处 的 平行 线 坐标 (AX;, AY;)i =1,2,…,n ,该 线段 围 成 了 比 给 定 区 域 范围 稍 小 的 
区 域 范围 ,所 有 待 布 绘 点 状 符号 的 中 心 点 都 确定 在 这 一 范围 内 ,以 保证 布 绘 在 区 域 
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边缘 的 点 状 符号 的 整体 均 落 在 区 域 范 围 内 。 
(2) 计算 由 线段 (AX,, AY,)i=1,2,…,n 围 成 的 闭合 区 域 的 面积 AREA , 进 
而 求 得 每 个 点 状 符号 平均 占用 面积 S ,根据 S 可 计算 出 点 状 符号 之 间 的 间距 DIS。 
按 以 下 公式 计算 : 
AREA = 3 (AXi11 — AX) . (AYin AZ) 


i=1 


SAREA 
NUM 


DIS=V3S 

(3) 计算 符号 布设 线 的 端点 坐标 。 
符号 布设 线 是 区 域内 一 组 水 平 扫描 线 , 相 
邻 符 号 布设 线 之 间 的 间距 为 DIS ,构成 面 
状 符号 的 所 有 点 状 符号 将 绘制 在 布设 线 
上 。 计 算 端 点 坐标 的 方法 是 从 闭合 边界 
坐标 的 首 点 开始 ,顺序 地 检查 相 邻 两 点 的 
连 线 是 否 穿 过 水 平 扫 描 线 。 若 没有 穿 过 ， 
则 继续 下 相 邻 两 点 连 线 的 检查 ; 若 穿 过 ， 
则 计算 该 连 线 和 它 所 穿 过 的 水 平 扫描 线 
的 交点 坐标 。 直 至 末 点 ,就 计算 获得 了 所 
有 布设 线 的 端点 坐标 。 例 如 ,图 14.26 所 示 的 图 形 , 可 计算 出 8 个 端点 坐标 : 
(BX ,BY)i=1,2,…,8。 

(4) 将 求 得 的 符号 布设 线 端点 坐标 配对 。 具 体 步 又 为 先 对 所 有 端点 坐标 按 了 
值 由 小 到 大 排序 ,例如 ,图 14.26 中 的 8 个 端点 坐标 按 Y 值 由 小 到 大 排序 后 得 到 
的 坐标 序列 为 : | (Xi, Y1), (Xe, Y8), (Xi, Y7), (X2, Ya), (Xs, Ys), (Xe, Y6)， 
(Xs3,，Y3),(X4, Y4)| ,然后 再 逐条 对 每 条 水 平 扫描 线 上 的 端点 坐标 按 X 值 进行 递 
增 排序 ,就 完成 了 布设 线 端 点 坐标 的 配对 。 例 如 对 上 面 的 坐标 序列 按 Y 值 相同 可 
分 为 三 组 ,对 每 组 按 X 值 由 小 到 大 排序 就 获得 坐标 序列 为 :{(Xi, Yi),(Xs, Ys)， 
(X2,Y2),(X7,Y7),(X3，Y3),(X4, Ya), (Xs, Ys), (Xe, Ye)}o 

(5) 计算 符号 在 设 线 的 总 长 度 SLEN ,精确 调整 布设 线 上 符号 间距 DIS。 有 
以 下 公式 . 





图 14.26 布设 线 示 意图 


NB 
SLEN = 2 (X2; 一 X2; 1) ,NB 为 端点 个 数 
_ SLEN 
~ NUM 
(6) 在 布设 线 上 按 间 距 DIS 布 绘 指定 的 点 状 符号 。 即 按 顺 序 将 所 有 布设 线 


DI 
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入 口 参数 ; 数组 XY、 儿 元 素 个 数 入 ,数组 
GX,GY,/P, 元 素 个 数 轩 ,成 状 符号 个 数 NUM 






求 出 点 状 符号 的 尺码 5, 调 子 程序 求 闭合 
边界 内 5/2 处 的 平行 线 坐 标 存 数组 4X,4Y 








置 : 4REA=0 I=2 


AREA=AREAH(AX(D-A(I-I)*(AY(D-AYU-1)) 
[=1+1 










DIS= VAREAD*NUM 
YA4=YA(1)-MOD(YA(1),DIS) 
NA=0 [=2 







YB=AY(TD)—-MOD(AY(D,DIS) 





A=YA+DIS 
B=YB 







AK=(AX(D-AX(- DAAYD-AY(-1)) 






NA=NA+1 
DXNA)=AX(D+AK*(YA-AY(D) 
DY(NA)=YA YA=YA+DIA 





图 14.27 闭合 区 域 布 绘 点 状 符号 算法 流程 图 (1) 
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TBMEDXOD DJEDRRDXUOSETEM 
TBM=DY(D DY(D=DY(R) DO=TEM 





图 14.28 闭合 区 域 布 绘 点 状 符号 算法 流程 图 (2) 
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作为 一 连贯 的 直线 看 待 ,从 距离 直线 首 点 DIS /2 处 布 绘 第 一 个 符号 ,以 后 每 隔 长 
度 DIS 就 布 绘 一 个 符号 ,直至 全 部 NUM 个 符号 布 绘 完毕 。 
图 14.27、 图 14.28、 图 14.29 是 闭合 区 域内 布 绘 点 状 符 号 的 算法 流程 图 。 










SLEN=0 大 2 


SLEN=SLEN+DX(ND-DAX(I-1) 
E+1 








是 
DIS=SLENINUM 
Do=DIS/2 万 

DLEN=DXKU+D-DKD 
EX=DX(D+D 
EY=DY(N) K=1 


BX=EX+GX(K)-S/2 

BY=EY+GY(K)-S/2 
CALL PLGT(BX,BY,IP(K) 
天 = 天 + 上 








是 


D=D+DIS 


图 14.29 闭合 区 域 布 绘 点 状 符号 算法 流程 图 (3) 
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思 考 题 


1. 编写 程序 实现 点 状 五 角 星 符号 的 绘制 。 
2. 编写 程序 实现 线 状 长 城 符号 的 绘制 。 
3. 编写 程序 实现 面 状 斜 线 填充 符号 的 绘制 。 
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2 基本 地 形 因子 分 析 算 法 


2 
2. 
2. 

















1 坡 面 因子 提取 的 算法 基础 
2 坡度 、 坡 向 
3 坡 形 











3 地 形 特征 提取 算法 


3: 
3. 2 基于 规则 格 网 DEM 数据 提取 山 将 与 山谷 线 的 典型 算 ; 


1 地 形 特征 点 的 提取 








4 通 视 分 析 算 法 
12. 4. 1 判断 两 点 之 间 的 可 视 性 的 算法 
12. 4. 2 计算 可 视 域 的 算法 


























第 13 章 空 间 数据 挖掘 算法 
1 概述 
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2 分 类 算法 
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1 数据 分 类 的 基本 过 程 








，2 决策 树 分 类 概述 
. 3 决策 树 的 特点 
. 4 二 又 决策 树 算法 与 分 类 规则 的 生成 
. 5 决策 树 分 类 算法 
. 6 决策 树 属 性 的 选取 

. 7 改进 决策 树 性 能 的 方法 

















3 泛 化 规则 算法 


3. 
3. 
3. 
4 相关 分 析 


1 概念 层次 
2 面向 属性 泛 化 的 策略 与 特点 
3 基于 规则 的 面向 属性 泛 化 方法 














13. 4. 1 两 要 素 间 的 相关 分 析 
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13. 8. 1 主 成 分 分 析 的 基本 原理 


4. 2 多 要 素 之 间 的 相关 分 析 
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5. 
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6. 
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;这 


. 5 嵌 


加 归 分 析 
1 一 元 线 














3 关联 规则 算法 


生 回 归 模 型 


2 多 元 线性 回归 模型 


3 非 线 性 回 
4 回 

系统 聚 类 分 析 
1 概述 





























判别 分 析 
距离 判别 
费 歌 判别 法 





1 
2 
3 





贝 叶 斯 判别 法 





归 模 型 
归 分 析 与 相关 分 析 


聚 类 要 素 预 处 理 
.3 分 类 统计 量 
.4 系统 聚 类 法 
他 聚 类 方法 概述 


4 判别 分 析 应 注意 的 问题 


主 成 分 分 析 




















13. 8. 2 主 成 分 分 析 的 方法 


思 考题 
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1 地 


图 从 














2 地 图 符 








点 状 地 
1 圆 的 绘制 
2 椭圆 的 绘制 











3 多 边 形 的 绘 种 


U2 


站 





4 五 角 星 的 绘 
线 状 地 
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图 





号 构成 元 素 组 成 
导 几 何 特征 
3 基于 SVG 的 地 


AD 


们 学 





描述 模型 











图 符号 的 绘制 


图 符号 的 绘制 








14. 3. 1 平行 线 绘制 
14. 3. 2 虚线 绘制 
14. 3. 3 短 齿 线 的 绘制 
14. 3. 4 铁路 线 的 绘制 
14. 3. 5 境界 线 的 绘制 
14. 4 面 状 地 图 符号 的 绘制 
思考 题 
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